AI 주요 서비스와 도구 (1)#

AI 모델을 만드는 조직들이 있습니다. 그들은 AI 모델을 공개하기도 하고, AI 모델을 이용해 자체적인 서비스를 제공하기도 하며, 개발자들이 AI 모델을 이용할 수 있도록 API를 제공하기도 합니다. 공개된 AI 모델을 바탕으로 또 다른 누군가는 자신들의 목적에 맞게 최적화한 “파생 모델”을 만들어 다시 공개하거나, 서비스/API로 제공하기도 합니다.

한편, 많은 팀은 모델을 직접 학습시키기보다 누군가 제공하는 API를 이용해 제품에 AI 기능을 빠르게 통합합니다. 이런 생태계 안에서 다양한 서비스와 도구들이 계속 등장하고 있고, 스타트업부터 대기업까지 폭넓은 조직이 AI 기술을 비즈니스에 적용하도록 돕고 있습니다. 이 장에서는 잘 알려진 AI 서비스와 도구들을 중심으로, 각각이 제공하는 기능과 활용 방법을 소개하겠습니다.

ChatGPT (made by OpenAI)#

ChatGPT는 2022년 11월 30일에 OpenAI에서 출시한 채팅형 AI 서비스입니다. 출시 후 5일 만에 백만 명의 사용자가 가입했고, 두 달 만에 월간 사용자 수가 일억 명 규모에 도달했다는 분석도 있었습니다. 이는 ChatGPT가 이전의 여러 AI 서비스들에 비해 “일반 사용자가 바로 써도 쓸 만한 완성도”를 보여주었음을 시사했고, ChatGPT 출시 이후로 AI 서비스에 대한 전 세계적인 관심이 크게 높아졌습니다.

ChatGPT는 초기에는 GPT-3.5 계열 모델을 기반으로 했고, 이후 GPT-4가 유료 플랜을 중심으로 제공되었습니다. 또한 2024년에는 GPT-4o가 발표되었는데, GPT-4o의 “o”는 “omni”의 약자이며, 텍스트뿐 아니라 음성/이미지 같은 여러 입력·출력을 더 자연스럽게 다루는 방향을 강조합니다.

중요한 점은, 단순히 “모델이 더 똑똑해졌다”를 넘어서 대화 경험이 더 매끄러워졌다는 것입니다. 예를 들어 음성 대화에서는 응답 지연이 길면 대화 자체가 어색해지는데, 처리 경로가 개선되면서(또는 여러 단계로 나뉘어 처리되던 흐름이 더 통합되면서) 체감 속도가 빨라지고, 실시간 대화 같은 활용이 훨씬 쉬워졌습니다. OpenAI에서 GPT-4o를 발표하는 영상을 보면 줄곧 음성으로 대화를 이어가는데, 이런 형태의 데모는 응답이 수 초씩 걸리던 시기에는 보여주기 어려웠던 모습이죠.

또한 OpenAI는 2025년 12월 11일에 GPT‑5.2를 발표했습니다(공식 소개). GPT‑5.2는 스프레드시트/프레젠테이션 제작 같은 전문 지식 업무, 코딩, 긴 문서(긴 컨텍스트) 이해, **도구 호출(에이전트형 작업)**에서 성능을 강화했고, 실제 서비스 사용 기준으로는 할루시네이션 오류가 줄었다고 소개합니다. 즉, “더 자연스럽게 대화한다”를 넘어서, 복잡한 일을 처음부터 끝까지 맡길 때의 완성도와 신뢰도를 끌어올리는 방향의 업데이트라고 이해하면 됩니다.

이제 ChatGPT를 활용하는 다양한 방법들에 대해 이야기해 보겠습니다.

정보 검색#

ChatGPT를 이용하면 구체적인 검색 키워드를 잘 떠올리지 못하는 상황에서도, 친구에게 질문하듯 다소 애매한 문장으로 “무엇을 찾고 싶은지”를 설명하고 도움을 받을 수 있습니다. 서비스 초기에는 학습 데이터의 시점 이후에 벌어진 일(최신 뉴스/최신 제품 정보 등)에 대해서는 한계가 뚜렷했지만, 이후 웹 검색/브라우징 같은 기능이 추가되며 “최신 정보를 참고한 답변”이 가능해지는 방향으로 개선되었습니다.

ChatGPT가 출시된 뒤 검색 시장에 대한 위기감이 커졌다는 보도(예: 구글의 “코드 레드” 일화)는 꽤 유명합니다. 개인적으로도 예전에는 검색의 1옵션이 구글이었다면, 지금은 “ChatGPT로 먼저 정리하고, 필요하면 원문을 확인한다”에 더 가까워졌습니다.

다만 AI 모델에는 할루시네이션 문제가 있기 때문에, 중요한 의사결정/업무/법적·금전적 판단에 쓰는 정보라면 출처 확인과 교차 검증이 필요하다는 점을 꼭 명심해야 합니다.

요약, 번역, 글쓰기, 검수(교정)#

ChatGPT를 이용하면, 긴 문서나 기사 등의 내용을 요약하여 중요한 정보만 추출할 수 있으며, 다양한 언어로 맥락에 맞게 번역할 수 있습니다. 그리고 ChatGPT는, 사용자가 요청한 주제에 대해 글을 작성할 수 있고, 사용자가 작성한 글을 검수하고 교정하는데에 도움을 줄 수 있습니다.

코드 작성 및 검토#

개발자들은 ChatGPT를 활용하여 코드 작성 및 검토 작업을 효율적으로 수행할 수 있습니다. 개발하고자 하는 클래스나 함수에 대한 요구사항을 작성하여 요청하면 소스 코드 및 그에 대한 설명을 응답으로 받을 수 있습니다. 그리고 사용자가 작성한 소스 코드를 제공하여 검토 요청하면 문제가 되는 부분에 대해 수정 방향을 제안 받을 수 있습니다.

개발자가 아니더라도 ChatGPT를 이용하여 업무 효율화 및 자동화에 간단한 소프트웨어를 쉽게 적용할 수 있습니다. 예를 들면, “https://some.ecommerce.site/some/product/id 이 상품 페이지를 탐색하여 상품명과 가격 정보를 추출하는 python 코드를 작성해 주세요.”라고 질의하여 python 코드를 얻을 수 있습니다. 그리고 “위의 python 코드를 매일 실행하여 날짜별로 가격을 엑셀 파일에 저장하고 싶습니다. 나는 개발자가 아니고 python 코드를 실행해 본 적이 없습니다. 무엇을 해야할지 단계적으로 설명해 주세요.”라고 질의하여 환경 구성을 위한 일련의 과정을 제공받을 수도 있습니다.

데이터 분석 및 시각화#

ChatGPT는 다양한 형태의 데이터를 입력 받아서, 분석하고, 그 결과를 다양한 형태로 출력할 수 있습니다. 데이터를 입력할 때는, 텍스트로 직접 입력할 수도 있고, 엑셀 파일 등을 업로드할 수도 있고, 구글 스프레드시트 등의 구글 워크스페이스 파일을 선택하여 입력할 수도 있습니다. 그리고 결과를 출력할 때는 텍스트로 분석 결과를 출력할 수도 있고, 그래프로 출력할 수도 있습니다. 예를 들어, 진행 업무와 예정 업무 목록이 정리된 구글 스프레드시트 문서를 첨부하고, “‘진행 업무’와 ‘예정 업무’ 각각에 대하여 ‘구분’별로 ‘개발기간’을 취합하여, ‘구분’별 총 개발기간을 막대 그래프로 그려주세요.”와 같은 요청을 하면, 그래프와 그에 대한 설명을 출력합니다.

이미지 생성#

ChatGPT를 이용하여 이미지를 생성할 수 있고, 생성된 이미지에서 영역을 선택한 후 해당 영역에 대해 수정 요청을 할 수도 있습니다. ChatGPT의 이미지 생성 기능을 이용하여, 미술 작품을 그릴 수도 있고, 앱 아이콘이나 게임 리소스 이미지 등을 생성할 수도 있습니다. 다만 아직까지는, 디테일한 요구 사항을 원하는대로 반영하기가 어렵다는 단점이 있습니다. 마치 천재성은 있지만 상당히 제멋대로인 화가와 비슷하다고 볼 수 있죠. 결과물이 정해져 있는 상태에서 그것을 실제로 그려나가야 하는 상황 말고, 방향만 정하고 결과물은 나온 것 봐서 정하는 상황이 더 어울릴 것입니다. 또는 ChatGPT가 생성한 결과물을 통해 아이디어를 얻어서 그것을 발전시키거나 별도로 다시 만드는 접근도 좋습니다.

동영상 생성#

ChatGPT 자체에 동영상 생성 기능이 “완전히 통합”되어 있다고 보기는 어렵지만, OpenAI의 동영상 생성 서비스인 Sora에서 동영상을 만들 수 있습니다. Sora는 텍스트 프롬프트로 짧은 영상을 생성하거나, 이미지/기존 영상 같은 입력을 바탕으로 스타일을 바꾸거나 일부 장면을 변형하는 등(리믹스/편집) 다양한 방식으로 결과물을 만들 수 있고, 마음에 드는 방향이 나올 때까지 반복 생성하며 다듬는 워크플로에 잘 맞습니다.

아이디어 도출#

예전에 컴퓨터와 인간을 비교할 때, 창의성은 인간 고유의 능력으로 여겨지곤 했습니다. 하지만 인간의 뇌와 비슷한 방식으로 학습하고, 결과물을 “생성해 내는" 생성형 AI 모델은 이제 창의적인 결과물을 만드는 데에도 인간에게 도움을 줄 수 있게 되었습니다. ChatGPT를 통해, 새로운 프로젝트에 대한 아이디어를 구하거나, 각종 이름이나 문구들을 정하는 데에도 큰 도움이 됩니다.

문제 해결#

위에서 설명한 모든 활용 방법들이 결국은 “문제 해결"의 범주 안에 포함됩니다. 그리고 그 외에도 ChatGPT를 이용하여 다양한 문제들을 해결할 수 있습니다. 문제 상황에서, 문제에 대하여 구체적으로 설명하고, 해결책을 찾아달라고 요청한다는 것으로 일반화 해볼 수 있습니다.

GPTs#

GPTs는 ChatGPT의 “맞춤형 버전”들의 모음이라고 보면 됩니다. 즉, 나만의 GPT를 만들 때 보통 아래 요소들을 조합합니다.

지침(Instructions): 말투/역할/금지사항/출력 형식 같은 규칙
지식(Knowledge): 내가 올린 문서/자료를 참고해 답하게 하기(일종의 “문서 기반 답변”)
도구(Actions): 필요할 때 외부 API를 호출해 결과를 받아 답변에 반영하기(= Function Calling의 한 형태)

앞서 RAG를 설명할 때 이야기했듯이, LLM은 기본적으로 “이미 학습한 지식”을 바탕으로 답하기 때문에, 사내 문서나 최신 정책처럼 모델이 원래 모르던 정보를 다뤄야 할 때는 문서를 찾아 붙여 주는 방식이 유리합니다. GPTs는 이런 “문서 기반 답변”과 “도구 호출”을 비교적 쉽게 구성할 수 있게 해 주기 때문에, ChatGPT의 활용 범위를 크게 넓혀 주는 기능이라고 할 수 있습니다.

내 GPT를 만들 때는 “만들기(Create)” 탭에서 GPT Builder와 대화를 통해 만들 수도 있고, “구성(Configure)” 탭에서 직접 값을 입력할 수도 있습니다. 간단한 GPT는 Builder로도 충분하지만, 외부 API를 호출해야 하는 경우에는 보통 구성 탭에서 하단의 “작업(Actions)”을 추가해야 합니다.

외부 API를 호출한다는 것은 다른 서비스와의 연동을 의미하므로, 인증(보안) 설정과 **요청/응답 인터페이스 정의(OpenAPI 스키마 등)**가 필요합니다. 즉, “내가 어떤 API를 어떤 형식으로 제공할 것인지”를 명확히 정해 두어야 GPT가 그 도구를 안전하게 사용할 수 있습니다.

GPT 탐색(Explore GPTs)에서 필요에 맞는 GPT를 찾아 사용할 수 있지만, 아직은 “완성도 높은 GPT”가 눈에 띄게 많지는 않습니다. 시간이 지나면 자연스럽게 좋아질 것이라 생각했지만, 실제로는 목적별로 다양한 AI 서비스와 도구들이 빠르게 등장하면서, GPTs가 대중적으로 “폭발적으로 활성화”되는 분위기라고 보기는 어렵습니다.

그리고 아마도 독자 여러분들이 더 관심 가질만한 접근은, 내 비즈니스를 ChatGPT로 확장하기 위해 내 GPT를 만들 수 있다는 것이라 생각합니다. 예를 들어 내 GPT에서, 블로그나 SNS 서비스에 글을 바로 게시한다거나, 호텔이나 항공권을 바로 예약한다거나, 다른 독립적인 AI 서비스를 내 GPT에 연동할 수 있습니다.

Gemini (made by Google)#

2022년 11월에 ChatGPT가 출시되자, 구글에서 코드 레드를 발령하고 긴급 비상대책회의를 열었다는 이야기가 꽤 유명합니다. 이후 구글은 Bard를 내놓고 빠르게 개선을 이어갔고, 2024년 2월에는 Gemini(제미나이)라는 이름으로 리브랜딩했습니다. 2026년 1월 현재 Gemini는 품질과 기능 면에서 많이 따라잡았지만, 여전히 “AI 챗봇 하면 ChatGPT”를 먼저 떠올리는 사람이 더 많은 편입니다.

Gemini는 여러모로 ChatGPT와 비슷합니다. 이미 사람들이 “채팅으로 AI를 쓴다”는 사용 방식에 익숙해졌기 때문에, UI/UX나 핵심 기능을 너무 다르게 만들면 오히려 진입장벽이 생기기 때문이죠. 그래서 Gemini의 활용 방법도 큰 틀에서는 ChatGPT와 같습니다. 정보 검색, 요약, 번역, 글쓰기, 검수(교정), 코드 작성 및 검토, 데이터 분석, 아이디어 도출, 문제 해결 등에 널리 활용할 수 있고, 파일 업로드/분석, 이미지 생성/수정, 동영상 생성 같은 멀티모달 기능도 제공됩니다. (다만 일부 기능은 국가/계정/요금제에 따라 지원 범위가 다를 수 있습니다.)

**Gem(맞춤형)**은 ChatGPT의 GPTs와 매우 유사한 기능으로, 특정 목적에 맞춰 미리 **지침(Instructions)**을 설정하거나 **지식(Knowledge)**을 제공하여 “나만의 챗봇”을 만들어 쓸 수 있습니다. 매번 같은 프롬프트를 입력할 필요 없이 복잡한 요구사항이나 말투, 참고 자료를 미리 정의해 두고 반복적으로 활용할 수 있다는 점은 GPTs와 같습니다. 다만 2026년 1월 현재, GPTs의 Actions처럼 외부 API를 연결해 실제 작업(Task)을 수행하거나 도구를 호출하는 기능은 제공되지 않습니다.

한편 개발자 관점에서는, Gemini 앱 자체의 확장보다도 Gemini API(및 Vertex AI 등)를 통해 서비스에 모델을 붙이고, Function Calling/툴 연동으로 제품 기능을 확장하는 접근이 더 일반적입니다. 구글이 2024년에 Gemini API Developer Competition을 열고 큰 상금을 걸었던 것도 이런 방향성과 맞닿아 있다고 볼 수 있습니다.

Claude (made by Anthropic)#

Claude(클로드)는 Anthropic(엔트로픽)에서 개발한 생성형 AI 모델/서비스입니다. Anthropic은 전 OpenAI 연구진을 포함한 인물들이 공동 설립한 회사로 알려져 있으며, Claude는 “안전하게 유용한 답변을 한다”는 방향(예: Constitutional AI)으로도 자주 소개됩니다.

2026년 1월 기준으로 Anthropic은 Claude 4.5 시리즈를 공개했고, 그중 Claude Opus 4.5는 Anthropic이 공식적으로 “코딩, 에이전트, 컴퓨터 사용에 가장 뛰어난 모델”로 소개하는 최상위 모델입니다(공식 발표). Claude 역시 ChatGPT, Gemini와 마찬가지로 채팅 서비스(claude.ai)를 제공하며, 개발자들 사이에서도 코드 생성/리팩터링/디버깅/코드 리뷰 같은 작업에 특히 강한 모델로 자주 언급됩니다.

Perplexity#

Perplexity(퍼플렉시티)는 “AI가 검색을 대신해 주고, 답변과 함께 출처를 보여주는” 형태의 검색/리서치 서비스입니다(perplexity.ai). 일반 검색처럼 링크 목록만 던져주기보다, 질문의 의도를 정리해 요약 답변을 먼저 제시하고(필요하면 추가 질문으로 범위를 좁혀가며), 답변에 참고한 웹 문서 링크를 함께 제공합니다. 그래서 “어떤 주제에 대해 빠르게 개요를 잡고, 출처를 따라가며 확인”해야 하는 상황—예를 들어 시장/경쟁사 조사, 정책/용어 확인, 최신 이슈 파악—에서 특히 유용합니다. 다만 출처가 붙어 있어도 답변이 항상 정확하다는 의미는 아니므로, 중요한 내용은 원문을 직접 확인하는 습관이 필요합니다.

LLaMA (made by Meta)#

LLaMA(Large Language Model Meta AI, 라마)는 Meta에서 공개한 LLM 계열로, 많은 경우 “오픈소스”라기보다는 모델 가중치(Weights)가 공개된(open-weight) 모델이라고 이해하는 편이 더 정확합니다. 즉, 누구나 모델을 내려받아 실행하고(라이선스 조건 내에서), 필요한 경우 미세조정해 활용할 수 있어 연구/개발 생태계에서 영향력이 큽니다.

LLaMA는 Meta AI(meta.ai) 같은 채팅 서비스로도 접할 수 있지만, 서비스 제공 범위는 지역/계정에 따라 달라질 수 있습니다. 대신 LLaMA의 강점은 “직접 가져다 쓸 수 있다”는 점입니다. Meta의 다운로드 페이지나 Hugging Face 컬렉션에서 모델을 내려받아, Hugging Face Transformers 또는 Ollama 같은 도구로 로컬/서버 환경에서 실행할 수 있습니다. 이때 AI 모델은 하나의 실행 파일이 아니라 “입력 → 출력”을 계산하는 거대한 함수에 가깝기 때문에, 모델을 로드하고 토큰을 처리해 입출력을 연결해 주는 런타임/라이브러리가 함께 필요합니다.

이런 공개 모델의 의미는 단순히 “공짜로 쓸 수 있다”를 넘어서, 데이터를 외부로 보내지 않고도(또는 최소화하면서) 사내 환경에서 AI를 돌릴 수 있다는 선택지를 제공한다는 데 있습니다. 다만 로컬 실행은 하드웨어/운영 부담이 생길 수 있고, 공개 모델도 할루시네이션·보안·저작권·라이선스 같은 이슈에서 자유롭지 않기 때문에, 실제 제품에 적용할 때는 용도에 맞는 검증과 가드레일이 필요합니다.