본문 바로가기
개발용어

AI란? 생성형AI란?

by devscb 2024. 11. 14.
반응형

AI란? 인공지능이란?

인공지능(AI, Artificial Intelligence)은 인간의 지능을 모방하거나 대체하는 기술입니다.
컴퓨터 과학과 공학, 심리학 등 다양한 분야에서 연구되고 있으며, 다음과 같은 특징을 가지고 있습니다.

1.지능의 구현: 인공지능은 인간의 지능을 모방하여 다양한 문제를 해결할 수 있습니다. 이를 위해 기계학습, 딥러닝, 자연어 처리 등의 기술이 사용됩니다.
2.자동화: 인공지능은 자동화를 통해 인간의 노동력을 대체하거나 보완할 수 있습니다. 예를 들어, 자율주행 자동차나 로봇 등은 인공지능을 이용하여 자동으로 운전하거나 작업을 수행합니다.
3.예측과 추론: 인공지능은 데이터를 분석하여 미래를 예측하거나, 주어진 정보를 바탕으로 추론을 할 수 있습니다. 이를 통해 의료, 금융, 마케팅 등 다양한 분야에서 활용됩니다.
4.인간과의 상호작용: 인공지능은 인간과 상호작용할 수 있습니다. 이를 통해 챗봇, 음성인식 비서, 가상 비서 등이 개발되어 사용되고 있습니다.
5.다양한 분야에서의 활용: 인공지능은 의료, 금융, 교육, 제조 등 다양한 분야에서 활용되고 있습니다. 이를 통해 인간의 삶을 더욱 편리하고 풍요롭게 만들어 줍니다.

산업혁명으로 인해 기계가 육체적 노동을 대신해주게 된 것과 같이,
컴퓨터와 AI는 정신적 노동을 대신해주게 되었다고 할 수 있습니다.

인공지능, 머신러닝, 딥러닝

아래와 같이 인공지능의 하위분류로 머신러닝이 있고,
머신러닝 하위분류로 딥러닝이 있습니다.

@startuml

rectangle "인공지능(Artificial Intelligence)" {
rectangle "머신러닝(Machine Learning)" {
rectangle "딥러닝(Deep Learning)"
}
}

@enduml

  • 머신러닝(Machine Learning) : 인공지능의 한 분야로,
    컴퓨터가 데이터를 분석하고 패턴을 학습하여 스스로 학습하는 능력을 갖추는 것입니다.
    머신러닝은 데이터를 기반으로 예측, 분류, 군집화 등의 작업을 수행할 수 있습니다.
  • 딥러닝(Deep Learning) 머신러닝의 한 분야로,
    인공신경망(Artificial Neural Network)을 기반으로 하는 방법입니다.
    딥러닝은 다층 구조의 신경망을 사용하여 복잡한 문제를 해결하는데 특히 효과적이다.
    딥러닝은 이미지 인식, 음성 인식, 자연어 처리 등 다양한 분야에서 활용되고 있습니다.
    딥러닝은 사람의 뉴런을 모방한 논리적 구조체를 학습시켜서 다양한 처리를 할 수 있게 합니다.

지도학습, 비지도학습, 강화학습

머신러닝에서 컴퓨터가 학습을 하기 위해 크게 3가지 (지도학습, 비지도학습, 강화학습) 가 있습니다.
각각에 대한 설명은 다음과 같습니다.

  • 지도학습(Supervised Learning)
    지도학습은 입력 데이터와 그에 대한 레이블 또는 타깃 데이터가 함께 제공되어 학습하는 방법입니다.
    이러한 데이터를 사용하여 모델을 학습시키고, 새로운 입력 데이터에 대한 예측이나 분류를 수행할 수 있습니다.
    예를 들어, 아래 그림과 같이 input data에 사과 이미지와 이것은 사과라는것을 Model에 계속 학습시키고,
    사과 모양의 이미지을 물어보면 답변으로 "이것은 사과다"라고 학습시키는 방법입니다.

 

  • 비지도학습(Unsupervised Learning)
    비지도학습은 입력 데이터에 대한 레이블이 제공되지 않는 상태에서 데이터의 패턴이나 구조를 학습하는 방법입니다.
    비지도학습은 데이터의 숨겨진 구조나 관계를 발견하거나 데이터를 군집화하는 데 사용됩니다.
    예를 들어, 고객 구매 기록을 사용하여 유사한 구매 패턴을 가진 고객들을 군집화하는 모델을 학습할 때,
    입력 데이터는 고객의 구매 기록이며, 모델은 유사한 패턴을 가진 고객들을 군집화합니다.
    예를 들어, 아래 그림과 같이 input data에 사과이미지와 바나나 이미지를 input data를 넣어주면
    Model 은 이것이 사과인지 바나나인지 모르나, 비슷한것끼리 분류하도록 결과물을 내놓도록 하는 학습방식입니다.

 

  • 강화학습(Reinforcement Learning)
    강화학습은 에이전트가 환경과 상호작용하며 보상을 최대화하는 방법을 에이전트에게 학습하는 방법입니다.
    에이전트는 특정 상태에서 특정 행동을 선택하고, 그에 대한 보상(또는 벌점)을 받습니다.
    이러한 보상을 기반으로 에이전트는 보상을 최대화하는 행동을 선택하는 방식으로 학습합니다.

예를 들어 아래 그림과 같이,
개가 나뭇가지를 주워 주인에게 주면(action, 행동), 주인(environment, 환경)이 개(agent, 에이전트)에게
간식(reward, 보상)을 줍니다.
그러면 개(agent)는 이 행동을 하면 좋구나라고 학습을 하게 되고,
반대로 개가 짖어서(action) 주인(envirenment)이 혼내면(Penalty, 패널티) 이 행동을 하면 안되겠구나라고 학습하게 되는 방식입니다.

생성형 AI

생성형 AI(Generative AI)는 인공지능의 한 분야로,
새로운 콘텐츠를 생성하는 능력을 갖춘 시스템을 의미합니다.
생성형 AI는 주어진 데이터나 패턴을 기반으로 새로운 이미지, 음악, 텍스트 등을 생성할 수 있습니다.
학습얘기하다가 생성형AI가 왜 나왔나 싶은 분들이 있을 텐데요,
생성형AI는 학습을 통해서 만들어지기 때문입니다.
예를 들어, 생성형AI의 대표직인 학습기법인 GAN은 다음 그림과 같이 학습됩니다.

  1. Discriminator는 진짜 데이터를 진짜로 분류하도록 학습
  2. Generator가 생성한 데이터를 가짜로 분류하도록 학습
  3. Generator는 Discriminator를 속이도록 학습

생성형AI의 역사

  1. Deep Learning (DBN, 2006)
  • Deep Belief Network: input 과 output 사이의 hidden layer( 은닉층 ) 사전훈련 아이디어 최초 제시
  • 사전훈련이 올바른 초기값 선정에 도움 -> vanishing gradient problem, overfitting problem 극복가능
    • *Vanishing gradient problem: 은닉층을 많이 거칠 수록 오차가 줄어들어 , 아예 학습이 되지 않는 현상
    • *Overfitting problem: 훈련 데이터에 과도하게 최적화 되어 새로운 데이터에는 성능이 낮아지는 현상
  1. CNN (2011)
  • Convolutional Neural Network: 이미지 특징 추출 영역과 클래스 분류 영역으로 구분
  • 이미지 데이터의 패턴을 파악하고 분류가 가능해 영상과 이미지 인식 비전분야 에서 활용
  1. RNN (2014)
  • Recurrent Neural Network:시간의 흐름에 따라 변화하는 데이터 학습을 위한 인공신경망
  • 문자의 단어별 분류가 가능해 자연어처리 , 번역 및 비디오 분석 에 활용
  1. GAN (2014)
  • Generative Adversarial Nets: 정해진 정답 없이 데이터 생성기가 실제와비슷한 거짓 데이터 생성
  • 판별기는 데이터 진위 판별
  • 직접 이미지, 음성 생성이 가능하여 이미지, 영상 합성 분야 에 활용
  1. Transformer (2017)
  • 문장의 단어와 같은 데이터 관계와 의미 학습이 가능한 신경망
  • 텍스트 및 음성과 같은 자연어 실시간 처리 및 기존 모델들 대비 실행 속도가 빨라 CNN, RNN 활용분야 대체 가능
  1. LLM (2018)
  • Large Language Model: 대규모 데이터 셋을 기반으로 텍스트 및 다양한 콘텐츠를 인식하고 요약 , 번역 , 예측 , 생성 분야에 활용
  1. Multi modal (2020)
  • 이미지, 텍스트 , 음성 등 다양한 데이터 학습으로 인간과 같이 유연한 사고가 가능한 한 단계 높은 차원의 모델
  1. VIT (CV) (2020)
  • Vision Transformer: 기존 트랜스포머 알고리즘을 비전분야에 적용 이미지를 패치단위로 쪼개 시퀀스로 전환 후 Transformer 에 입력
  1. Diffusion (2020)
  • Deep generative model 중 하나로, 이미지 생성 분야에서 가장 잘 작동하는 모델

생성형 AI의 활용

  • 언어 생성(글,문장) : 의사소통, 언론, 출판, 대본 생성에 활용
  • 이미지 생성(그림) : 광고, 출판 일러스트레이션, 기업 이미지, 소셜 이미지 생성에 활용
  • 코덱스(코드생성) : 웹디자인, 소프트웨어 개발, 스크립팅 등에 활용

대표적인 생성형 AI 서비스/회사

  • 언어 생성형 : ChatGPT, bing Chat, Gemini
  • 이미지 생성형 : mid journey, DALL-E, bing 이미지 크리에이터, Lexica
  • 비디오 생성형 : runway, fliki, tavus
  • 코드 생성형 : github copilot, mutable.ai, replit
  • 음성 생성형 : listnr, broadn, resemble.ai
  • 3D : mirage, csm
  • 기타 : sonify, ai dungeon

 

728x90
반응형

댓글