AI 주요 개념 (1)#

AI 기술을 효과적으로 활용하기 위해서는 AI 관련 주요 개념을 이해할 필요가 있습니다. 그래야 AI 서비스와 도구들이 어떤 원리로 동작하는지, 그리고 최신 뉴스와 트렌드가 왜 중요한지까지 함께 이해할 수 있기 때문입니다.

AI 기술은 지금도 빠른 속도로 발전하고 있어 관련 서비스와 도구가 계속 업데이트되고, 새로운 소식도 끊임없이 등장합니다. 따라서 기본 개념을 탄탄히 잡아두면 변화의 흐름을 더 잘 따라가고, AI 활용 역량도 꾸준히 키워 나갈 수 있습니다.


AI (Artificial Intelligence, 인공지능)#

인간의 지능을 모방하여 텍스트/이미지/영상 등을 인식하거나 생성하는 등의 작업을 수행하는 컴퓨터 시스템입니다. 또는 그러한 기술 자체를 의미하기도 하고, 그 기술을 구현하는 것과 관련된 학문 분야를 의미하기도 합니다. 1940년대부터 관련 논의가 시작되었고, 1956년에 “Artificial Intelligence"라는 명칭이 공식화되었습니다.

AI는 능력의 수준에 따라 Weak AI(약인공지능)와 Strong AI(강인공지능)로 구분되기도 합니다. Weak AI는 특정 작업이나 문제 해결에 한정된 AI를, Strong AI는 인간과 같은 수준의 지능과 의식을 가진 AI를 의미합니다. 이와 유사하게, ANI(Artificial Narrow Intelligence, 인공 특화 지능)와 AGI(Artificial General Intelligence, 인공 일반 지능)로도 분류할 수 있는데, ANI는 Weak AI와 비슷하고 AGI는 Strong AI와 비슷한 개념이라 보면 됩니다.

두 분류 체계는 사용되는 맥락이 조금 다릅니다. Weak/Strong은 상대적으로 오래전부터 논의되어 주로 철학적 관점에서 쓰였고, ANI/AGI는 기술적 관점에서 더 자주 사용됩니다. 현재(2025년 12월 기준) 우리가 일상적으로 접하는 대부분의 AI 서비스는 ANI에 해당하며, AGI의 등장을 언제로 볼 것인지는 여전히 다양한 의견이 존재합니다.


머신러닝(Machine Learning)과 딥러닝(Deep Learning)#

머신러닝은 모델을 설계하고 데이터를 이용해 그 모델을 학습시킨 뒤, 학습된 모델로 필요한 작업을 수행하는 기술이며 AI의 한 분야입니다.

예를 들어, (y = ax + b) 방정식과 이미 알고 있는 ((x_1, y_1)) 데이터가 주어졌을 때 (a)와 (b)를 구하고, 새로 주어진 (x_2)에 대해 (y_2) 값을 구하라는 문제가 있다고 가정해 봅시다. 이런 문제를 컴퓨터가 데이터로부터 규칙을 학습해 해결하도록 하는 것이 머신러닝입니다. (y = ax + b)처럼 입력 (x)와 출력 (y)의 관계를 표현하는 함수(또는 함수들의 집합)가 모델이 되고, 충분한 ((x, y)) 데이터로 학습해 적절한 파라미터(예: (a), (b))를 찾으면, 새로운 (x)가 주어졌을 때 (y)를 예측할 수 있게 됩니다.

딥러닝은 머신러닝의 하위 분야로서, 인간의 뇌 구조를 모방한 인공신경망(ANN, Artificial Neural Network)을 설계하고 학습시키는 기술입니다. 즉, 인공신경망을 기반으로 데이터로부터 복잡한 패턴을 학습하도록 만드는 머신러닝의 한 분야라고 볼 수 있습니다.


머신러닝의 학습 방법#

머신러닝의 학습 방법은 크게 4가지 정도로 분류됩니다.

지도 학습(Supervised Learning)#

입력과 출력 데이터 쌍을 이용하여 모델을 훈련시키는 학습 방식입니다. 예를 들어, 고양이 사진인지 아닌지 구분할 수 있는 모델을 만들기 위해, 고양이가 있는 사진과 없는 사진들로 학습시킬 수 있습니다. 이 경우에, 사진이 입력 값이고, 고양이가 있는지 없는지 여부가 출력 값이 됩니다. 또 다른 예로, 이메일 스팸 필터링 모델의 경우, 스팸 메일과 스팸이 아닌 메일로 학습시킬 수 있습니다.

비지도 학습(Unsupervised Learning)#

출력 없이 입력 데이터만 이용하여 모델을 훈련시키는 학습 방식입니다. 지도 학습에서는 입력에 대한 정답이 무엇인지를 학습시켜서, “이것은 A이고, 이것은 B입니다. 그렇다면 저것은 무엇일까요?“와 같은 문제를 해결하는 모델을 만드는 반면, 비지도 학습에서는 정답이 없는 데이터를 이용해 훈련시켜서, 비슷한 특성을 가진 데이터끼리 군집화하고(이것을 클러스터링이라고 합니다), “A, B, C 그룹이 있습니다. 이 데이터는 어느 그룹에 속하나요?“와 같은 문제를 해결하는 모델을 만듭니다. 예를 들어, 뉴스 데이터들을 학습시켜서 유사한 내용들을 묶어주는 기능이나, 상품 데이터들을 학습시켜서 연관 상품 또는 추천 상품을 제공해주는 기능을 구현할 때 활용할 수 있습니다.

준지도 학습(Semi-Supervised Learning)#

준지도 학습은 지도 학습과 비지도 학습을 결합한 것으로서, 일부 데이터는 출력값이 있고, 나머지는 없는 데이터를 함께 사용하여 모델을 훈련시키는 학습 방식입니다. 현실 세계의 데이터들은 원하는대로 정제되어 있지 않은 경우가 많습니다. 예를 들어, 고양이 사진인지 아닌지 구분하는 모델을 만들려고 하는데, 모델을 훈련시키는데에 사용하려는 사진 데이터 중 일부는 고양이의 유무가 기록되어 있지만, 나머지는 고양이의 유무를 알 수 없는 상황일 때 사용할 수 있습니다. 이 경우, 고양이 유무를 판별하기 위해 입력된 사진에 대하여, 해당 사진에 부합하는 데이터 클러스터를 찾고, 그 클러스터에 포함된 데이터들 중 출력 값이 있는 것들을 기반으로 하여 결과 값을 구할 수 있는 것이죠.

강화 학습(Reinforcement Learning)#

강화 학습은 머신러닝 모델에서 출력한 결과 값을 평가하는 과정을 반복하여 모델을 강화시키는 학습 방식입니다. 강아지 조련사가 강아지를 훈련시키는 과정에 비유될 수 있는데요, 조련사가 강아지에게 명령을 했을 때, 강아지의 반응이 맞는 방향이면 보상을 주고, 틀린 방향이면 보상을 주지 않는 일련의 행동을 반복하는 것과 유사합니다. 강화 학습은 다른 학습 방법들과 상호 배타적인 관계가 아닙니다. 예를 들어, 지도 학습을 통해 초기 모델을 훈련시킨 후, 강화 학습을 통해 그 모델을 추가 훈련하여 성능을 향상시킬 수 있습니다.


LLM(Large Language Models, 대규모 언어 모델)#

LLM은 방대한 양의 텍스트 데이터를 학습하여 언어를 이해하고 생성할 수 있는 딥러닝 모델입니다. OpenAI의 GPT(Generative Pre-trained Transformer), 구글의 Gemini, 앤트로픽의 Claude(클로드) 등이 대표적인 LLM이라 볼 수 있습니다.

딥러닝은 인공신경망을 설계하고 학습시키는 기술이며, 인공신경망은 목적에 따라 여러 유형으로 나눌 수 있습니다. CNN(Convolutional Neural Networks, 합성곱 신경망), RNN(Recurrent Neural Networks, 순환 신경망), 트랜스포머(Transformers) 등이 대표적이며, 오늘날의 LLM은 주로 트랜스포머 기반으로 구현됩니다. CNN은 이미지처럼 2차원 데이터를 처리하는 데 자주 쓰이고, RNN과 트랜스포머는 자연어 처리, 음성 인식, 번역 등에 활용됩니다. 특히 자연어 처리 분야에서는 트랜스포머 기반 LLM이 주류가 되면서 RNN의 비중이 크게 줄었습니다.