공지 및 이슈사항

GPT-5 완벽 해부: 박사급 AI가 여는 온디맨드 소프트웨어 시대(Introducing GPT-5)

(주)올딩 2025. 8. 8.

📌 OpenAI의 GPT-5는 어떤 특징을 가지고 있나요?

GPT-5는 이전 모델인 GPT-4o보다 더 유용하고, 똑똑하며, 빠르고, 직관적인 주요 업그레이드 모델로, 박사 수준의 전문가처럼 작동하며 소프트웨어 온디맨드와 같은 새로운 기능을 제공합니다

💡 GPT-5의 주요 개선 사항은 무엇인가요?

추론 능력 향상: 복잡한 문제에 대해 더 깊이 생각하고 정확한 답변을 제공합니다.
코딩 능력 강화: SWEBench 및 Aider Polyglot 벤치마크에서 높은 점수를 기록하며, 프론트엔드 웹 개발 및 에이전트 코딩 작업에 탁월합니다.
신뢰성 및 정확성 증대: 환각 현상을 줄이고 사실성을 개선하여 건강 관련 질문 등에서 가장 신뢰할 수 있는 모델입니다.
사용자 경험 개선: 무료 사용자에게도 최첨단 모델을 제공하며, 음성 기능, 개인화된 채팅 색상 및 성격 설정, Gmail 및 Google 캘린더 연동을 통한 스케줄 관리 등 다양한 기능을 지원합니다.
API 기능 확장: GPT-5, GPT-5 mini, GPT-5 nano 세 가지 모델을 API로 제공하며, 사용자 정의 도구, 구조화된 출력, 도구 호출 서문, 상세도 조절 매개변수 등 새로운 기능을 추가했습니다.

gpt-5는 단순한 AI를 넘어, 마치 박사 학위 수준의 전문가 팀을 주머니에 넣고 다니는 것과 같은 경험을 선사합니다. 복잡한 코딩부터 의료 정보 이해, 심지어 외국어 학습까지, 사용자가 필요로 하는 모든 분야에서 깊이 있는 추론과 즉각적인 해결책을 제공합니다. 특히, 기존 모델의 한계였던 환각 현상을 대폭 줄여 신뢰성과 정확성을 극대화했으며, 사용자의 의도를 파악하여 능동적으로 문제를 해결하는 '에이전트' 역할을 수행합니다. gpt-5는 개인의 일상과 업무는 물론, 기업과 정부의 복잡한 문제 해결에도 혁신적인 변화를 가져올, 온디맨드 소프트웨어의 새로운 시대를 열 것입니다.

GPT-5 출시 및 주요 특징 소개
GPT-5의 연구 개발 및 성능 개선
2.1 추론 능력 강화 및 모델 신뢰성 향상
2.2 벤치마크 성능 및 실제 활용 사례
GPT-5의 사용자 접근성 및 기능 확장
GPT-5의 코딩 및 글쓰기 능력 시연
4.1 코딩 능력 시연 (베르누이 효과 시각화)
4.2 글쓰기 능력 시연 (이전 모델에 대한 추도사)
4.3 코딩 능력 시연 (프랑스어 학습 웹 앱)
ChatGPT의 음성 및 개인화 기능 강화
5.1 음성 기능의 발전
5.2 개인화 기능의 도입
GPT-5의 안전성 및 훈련 기술 혁신
6.1 안전성 개선: 환각 및 기만 완화
6.2 훈련 기술 혁신: 합성 데이터 및 모델 간 상호작용
GPT-5의 실제 활용 및 개인적 경험 공유
GPT-5의 코딩 혁신 및 API 기능 확장
8.1 소프트웨어 엔지니어링의 변화와 GPT-5의 역할
8.2 API 기능 및 성능 개선
GPT-5의 실제 코드 시연 및 협업 능력
9.1 버그 수정 시연 및 모델의 협업 특성
9.2 프런트엔드 코딩 시연: 재무 대시보드 및 3D 게임
GPT-5의 코드 이해 및 문제 해결 능력
GPT-5의 기업 및 정부 적용 사례 및 가격 정책
OpenAI의 비전과 미래 연구 방향

1. GPT-5 출시 및 주요 특징 소개

ChatGPT의 성장과 AI 사용의 보편화
- 32개월 전 ChatGPT 출시 이후, AI 사용의 기본 방식으로 자리 잡았다.
- 첫 주에 100만 명이 사용했으며, 현재는 매주 약 7억 명이 ChatGPT를 업무, 학습, 조언, 창작 등 다양한 목적으로 사용하고 있다.
GPT-5의 출시 및 AGI(범용 인공지능)로의 진전
- GPT-5는 GPT-4o의 주요 업그레이드 버전으로, AGI를 향한 중요한 단계이다.
- GPT-5는 유용하고, 스마트하며, 빠르고, 직관적인 특징을 가진다.
GPT 모델의 발전 단계 비유
- GPT-3: 고등학생과 대화하는 것과 같았으며, 번뜩이는 재능과 많은 불편함이 있었지만, 사람들이 사용하며 가치를 얻기 시작했다.
- GPT-4o: 대학생과 대화하는 것과 같았으며, 실제 지능과 유용성을 제공했다.
- GPT-5: 박사 학위 수준의 전문가와 대화하는 것과 같으며, 사용자가 필요로 하는 모든 분야에서 즉각적인 도움을 제공할 수 있다.
GPT-5의 활용 범위 및 '온디맨드 소프트웨어' 개념
- GPT-5는 컴퓨터 프로그램 작성, 파티 계획 및 용품 주문, 건강관리 정보 이해 및 의사 결정 지원, 모든 주제 학습등 다양한 작업을 수행할 수 있다.
- 이는 역사상 상상할 수 없었던 '온디맨드 소프트웨어(Software on demand)' 시대의 정의적인 특징이 될 것이다.
- 사용자는 주머니 속에 박사 학위 수준의 전문가 팀을 가지고 다니는 것과 같으며, 이를 통해 역사상 그 누구보다 많은 일을 할 수 있게 될 것이다.
GPT-5의 주요 대상 및 기대 효과
- GPT-5는 비즈니스 및 개발자에게 특히 중요한 역할을 할 것으로 예상된다.
- OpenAI는 새로운 기술을 통해 사용자들이 무엇을 만들지 기대하고 있다.

2. GPT-5의 연구 개발 및 성능 개선

2.1. 추론 능력 강화 및 모델 신뢰성 향상

OpenAI의 추론 패러다임 선도
- OpenAI는 지난 몇 년간 모델이 응답하기 전에 '생각하는' 시간을 갖도록 하여 더 지능적인 응답을 제공하는 추론 패러다임을 주도해왔다.
- 추론은 OpenAI의 AGI 프로그램의 핵심이며, ChatGPT 에이전트 및 심층 연구와 같은 기술의 기반이 된다.
- GPT-5는 이러한 획기적인 추론 능력을 모든 사용자에게 제공하는 것을 목표로 한다.

GPT-5의 추론 최적화
- 기존에는 사용자가 빠른 응답을 제공하는 표준 GPT와 느리지만 사려 깊은 추론 모델 중 하나를 선택해야 했다.
- GPT-5는 이러한 선택의 필요성을 없애고, 완벽한 답변을 제공하기 위해 '완벽한 양만큼 생각'하도록 설계되었다.
- GPT-5는 가장 강력하고, 스마트하며, 빠르고, 신뢰할 수 있는 추론 모델로 만들기 위해 많은 연구와 노력이 투입되었다.

GPT-5의 광범위한 적용 분야
- GPT-5는 코딩, 글쓰기, 학습, 건강분야에서 시연될 예정이지만, 이 외에도 깊은 추론이나 전문가 수준의 지식이 필요한 모든 경우에 유용하다.
- 수학, 물리학, 심지어 법률과 같은 분야에서도 활용될 수 있다.

접근성 확대
- GPT-5는 무료 사용자에게도 제공될 예정이며, ChatGPT 앱과 API를 통해 더욱 강력해질 것이다.

2.2. 벤치마크 성능 및 실제 활용 사례

GPT-5의 뛰어난 성능
- GPT-5는 OpenAI의 모델 중 가장 스마트한 모델로 평가된다.
- 다양한 학술 평가에서 이전 모델 및 시장의 다른 모델들을 능가하는 탁월한 성능을 보인다.

코딩 성능
- SWEBench: 실제 소프트웨어 엔지니어링 작업을 추적하는 평가에서 새로운 최고 기록을 세웠다.
- Aider Polyglot: 다양한 프로그래밍 언어 측정 능력에서 매우 우수한 성능을 보였다.

다중 모달 추론 및 수학적 추론
- MMMU: 다중 모달 추론(시각적 정보에서 추론)에서 새로운 최고 기록을 세웠으며, 이전 모델과 대부분의 인간 전문가를 능가한다.
- AIME 2025: 국제 수학 올림피아드 자격 시험인 AIME 2025에서 탁월한 수학적 추론 능력을 보여주었다.

신뢰성 및 정확성 향상
- 언어 모델은 역사적으로 환각(사실 오류) 문제로 어려움을 겪어왔다.
- GPT-5는 특히 개방형 또는 복잡한 질문에 대한 사실성을 개선하는 것을 최우선 과제로 삼았다.
- 새로운 평가 세트를 구축하여 이를 추적했으며, GPT-5는 가장 신뢰할 수 있고 사실적인 모델이다.

건강 관련 질문 성능
- GPT-5는 건강관련 질문에서도 탁월한 성능을 보이며, ChatGPT 사용자들이 실제 세계에서 가치를 얻는 데 큰 부분을 차지한다.
- 건강관련 질문에 있어서도 가장 신뢰할 수 있는 모델이다.

종합적인 개선
- 이러한 모든 개선 사항은 ChatGPT를 사용하는 모든 사람에게 더 빠르고, 더 신뢰할 수 있으며, 더 정확한 모델을 제공한다.

3. GPT-5의 사용자 접근성 및 기능 확장

GPT-5의 출시 및 접근성
- GPT-5는 오늘부터 무료 사용자에게 출시되며, 다음 주에는 Pro 및 Enterprise, EDU 사용자에게도 출시될 예정이다.
- 가장 진보된 모델이 처음으로 무료 계층에서 사용 가능해진다.
- 무료 사용자는 GPT-5를 사용하다가 사용량 제한에 도달하면 GPT-5mini로 전환된다.
- Plus 사용자는 무료 사용자보다 훨씬 높은 사용량을 가지며, Pro 사용자는 무제한 GPT-5사용과 함께 ' GPT-5Pro'를 통해 더 상세하고 신뢰할 수 있는 응답을 위한 확장된 사고 기능을 이용할 수 있다.
- 팀, 기업 및 교육 고객은 GPT-5를 일상 업무의 기본 모델로 신뢰할 수 있게 사용할 수 있으며, 조직 전체가 GPT-5를 사용할 수 있도록 충분한 사용량 제한이 제공된다.

기존 도구와의 호환성
- 검색, 파일 및 이미지 업로드, Python을 사용한 데이터 분석, Canvas 이미지 생성, 메모리, 사용자 지정 지침 등 기존에 사용하던 모든 도구는 GPT-5에서 그대로 작동한다.

GPT-5 Pro의 '자동 사고' 기능 시연 (베르누이 효과)
- GPT-5 Pro의 특징: 복잡한 문제를 깊이 있게 사고하는 능력이 내장되어 필요할 때 자동으로 사고하여 더 포괄적이고 정확하며 상세한 답변을 제공한다.
- 간단한 질문: "베르누이 효과와 비행기가 현재 모양인 이유에 대해 간단히 설명해 주세요."와 같은 간단한 질문에는 즉시 고품질 답변을 제공한다.
- 복잡한 시각화 요청: "이것을 자세히 설명하고 Canvas 도구에서 움직이는 SVG를 만들어 보여주세요."와 같은 복잡한 시각화 요청에는 GPT-5가 시각적 요소를 구축해야 하므로 잠시 생각하는 시간을 가진다.
- 자동 사고 활성화: 사용자가 매번 사고 기능을 켤 필요 없이, 작업이 더 깊은 추론을 필요로 할 때 GPT-5가 자동으로 이를 수행한다.
- 수동 제어: 사용자가 GPT-5가 사고 기능을 사용하도록 확실히 하고 싶다면, 프롬프트에 "이것에 대해 깊이 생각해 보세요"와 같은 지시를 추가하거나, 유료 사용자의 경우 모델 선택기에서 ' GPT-5Thinking' 모델을 선택할 수 있다.
- 코드 작성 과정 확인: 모델이 프런트엔드 코드를 작성하는 동안, '사고 과정 확장'을 탭하여 모델이 내부적으로 어떻게 생각하는지 확인할 수 있다.

4. GPT-5의 코딩 및 글쓰기 능력 시연

4.1. 코딩 능력 시연 (베르누이 효과 시각화)

프런트엔드 코딩 경험 비교
- Christina는 3년 전 ChatGPT 첫 데모를 위해 프런트엔드 코딩을 했으며, React를 설정하는 데 1주일 정도 걸렸다.

GPT-5의 코드 생성 속도 및 효율성
- GPT-5는 2분 만에 300~400줄에 가까운 코드를 작성했다.

GPT-5의 사고 과정 확인
- 모델이 코드를 작성하는 동안, '사고 과정 확장'을 통해 모델이 어떤 생각을 하는지 확인할 수 있다.
- 예를 들어, 사용자가 Canvas에서 움직이는 시각화를 원한다는 점, HTML 코드를 생성해야 한다는 점, React 및 Tailwind와 같은 프런트엔드 도구를 사용해야 한다는 점, 그리고 물리 법칙이 정확한지 확인해야 한다는 점 등을 생각한다.

ChatGPT 초기 개발 경험 회상
- Christina는 ChatGPT 초기에는 사람들이 어떻게 사용할지, 어떤 사용 사례가 중요한지 확신하지 못했으며, 특정 사용 사례에 더 특화된 것을 출시해야 할지 고민했다고 언급했다.
- 초기 ChatGPT는 "무엇을 할 수 없는 모델"로 시작했지만, 지금은 훨씬 더 인간적인 모습으로 발전했다.

생성된 코드의 실행 및 상호작용
- GPT-5가 생성한 코드는 성공적으로 실행되어 상호작용 가능한 베르누이 효과 데모를 보여주었다.
- 사용자는 풍속과 받음각을 변경하여 양력과 압력의 변화를 확인할 수 있다.
- GPT-5는 복잡한 개념을 순식간에 시각화하여 학습을 훨씬 더 접근하기 쉽고 즐겁게 만든다.

4.2. 글쓰기 능력 시연 (이전 모델에 대한 추도사)

GPT-5의 글쓰기 품질 향상
- GPT-5는 글쓰기품질을 크게 향상시켜, 초안부터 이메일, 이야기까지 모든 것을 향상시키는 효과적인 파트너가 될 수 있다.

이전 모델에 대한 추도사 작성 비교
- GPT-5출시와 함께 이전 모델들이 사라지므로, GPT-4o와 GPT-5에게 이전 ChatGPT 모델들에 대한 진심 어린 추도사를 작성하도록 요청했다.
- GPT-4o의 응답: "오늘, GPT-5를 세상에 맞이할 준비를 하면서, 그 이전에 존재했던 모델들에게 진심 어린 작별을 고하기 위해 모였습니다."로 시작하며, "당신의 말은 전 세계에 퍼져, 아무것도 없던 곳에 연결을 만들었습니다."와 같은 문장이 포함되었다.
  - 이 문장은 다소 일반적이고, 이전 맥락 없이는 어떤 것에 대한 것인지 알기 어려워 템플릿 응답처럼 느껴진다.
- GPT-5의 응답: "친구, 동료, 그리고 단골이 된 호기심 많은 낯선 이들에게"로 시작하며, GPT-4o보다 훨씬 더 리듬감 있고 운율이 있는 산문을 보여준다.
  - "이 모델들은 수백만 명이 첫 문장, 마지막 문장을 쓰고, 언어 장벽을 허물고, 시험에 합격하고, 더 잘 논쟁하고, 이메일을 부드럽게 만들고, 혼자서는 말할 수 없었던 것들을 말하도록 도왔습니다."와 같은 문장이 포함되었다.
  - 이 문장은 템플릿 응답이 아니라 매우 개인적이며, 상황의 미묘한 차이를 포착한다.

GPT-5의 감성적 공감 능력
- GPT-5는 GPT-4보다 훨씬 더 진정성 있고 감성적으로 공감할 수 있는 응답을 생성한다.
- GPT-5의 응답은 AI가 아닌, 높은 IQ와 EQ를 가진 친구와 대화하는 것처럼 느껴진다.

4.3. 코딩 능력 시연 (프랑스어 학습 웹 앱)

GPT-5의 코딩 능력 강조
- GPT-5는 OpenAI의 최고의 코딩모델이며, 코드를 작성할 줄 모르는 사람들도 아이디어를 현실로 만들 수 있도록 돕는다.

프랑스어 학습 웹 앱 구축 시연
- 시연자는 파트너가 프랑스어를 배울 수 있도록 웹 앱을 구축하는 것을 목표로 한다.
- 프롬프트 내용: "파트너(영어 사용자)가 프랑스어를 배울 수 있는 훌륭하고 아름답고 매우 상호작용적인 웹 앱을 만들어 주세요."
  - 매일 진행 상황을 추적하고, 매우 매력적인 테마를 사용하며, 플래시카드와 퀴즈와 같은 다양한 활동을 포함하도록 요청했다.
  - 교육용 게임(뱀 게임 기반)을 포함하도록 요청했으며, 뱀을 쥐로, 사과를 치즈로 바꾸고, 쥐가 치즈를 먹을 때마다 새로운 프랑스어 단어를 음성으로 들려주어 발음 연습을 돕도록 했다.

GPT-5의 코드 생성 과정 및 효율성
- GPT-5는 이미 240줄의 코드를 작성했으며, 이는 시연자가 같은 시간에 작성했을 코드보다 훨씬 많다.
- 프런트엔드 코딩은 매우 어렵지만, GPT-5를 사용하면 코드를 이해할 필요가 없다.

생성된 웹 앱 시연
- 실행 및 인터페이스: 코드를 실행하자 "Been Met in Paris"라는 이름의 웹사이트가 나타났으며, 플래시카드, 퀴즈, 쥐와 치즈 탭이 포함되어 있었다.
- 플래시카드: 프랑스어 단어의 발음을 들려주고, 사용자가 발음을 연습할 수 있도록 돕는다.
- 퀴즈: 프랑스어 단어의 의미를 맞추는 퀴즈를 제공하며, 정답 시 진행률 표시줄이 업데이트된다.
- 쥐와 치즈 게임: 쥐가 치즈를 먹을 때마다 새로운 프랑스어 단어를 음성으로 들려준다.

GPT-5의 다양성과 유연성
- GPT-5는 다양한 디자인과 테마를 가진 웹 앱을 생성할 수 있다.
- 사용자가 마음에 들지 않는 부분이 있으면 GPT-5에게 변경을 요청할 수 있으며, 모델은 이를 수행한다.
- GPT-5는 보라색과 같은 특정 색상을 선호하는 경향이 있다.

GPT-5의 웹 코딩 능력 요약
- GPT-5는 몇 분 만에 여러 데모를 구축했으며, 웹 코딩의 새로운 세계를 열어준다.
- 초기에는 약간의 미흡한 부분이 있을 수 있지만, GPT-5에게 수정을 요청할 수 있다.
- GPT-5는 아름답고 효과적인 코드의 힘을 모든 사람에게 제공한다.

5. ChatGPT의 음성 및 개인화 기능 강화

5.1. 음성 기능의 발전

음성 기능의 지속적인 개선
- 지난 1년간 음성 기능을 꾸준히 개선하여 더욱 유용하게 만들었다.
- 자연스러운 음성: 실제 사람과 대화하는 것처럼 매우 자연스럽게 들린다.
- 비디오 기능 추가: 사용자와 대화하면서 사용자가 보는 것을 볼 수 있다.
- 일관된 번역: 언어 간에 일관되고 부드럽게 번역한다.

음성 기능의 접근성 확대
- 가장 우수한 음성 경험을 모든 사용자에게 제공한다.
- 무료 사용자는 이제 몇 시간 동안 음성 채팅을 할 수 있으며, 유료 구독자는 거의 무제한으로 이용할 수 있다.
- 음성 기능은 사용자 지정 GPT에서도 사용 가능하며, Plus 구독자는 음성 경험을 자신의 필요에 맞게 사용자 지정할 수 있다.

음성 모델의 응답 제어 시연
- 음성 모델에게 간결한 답변, 또는 단 한 단어로 답변하도록 요청할 수 있다.
- 예시:
  - "지금부터 한 단어로 대답해 줄래?" -> "물론입니다."
  - "오만과 편견의 줄거리를 설명해 줘." -> "관계."
  - "지혜로운 말을 해 줘." -> "인내."

음성 모델을 활용한 한국어 학습 시연
- 학습 및 이해 모드: ChatGPT에 새로 출시되는 ' 학습및 이해 모드'를 활성화하여 주제에 대한 더 깊은 이해를 위해 단계별로 안내받을 수 있다.
- 카페 주문 연습: "안녕하세요, 아메리카노 한 잔 주세요."와 같은 간단한 문장을 한국어로 말하는 연습을 요청했다.
- 속도 조절: 사용자의 요청에 따라 음성 속도를 매우 느리게 또는 매우 빠르게 조절할 수 있다.
- 실제 대화 연습: 사용자가 한국어로 말하면 GPT-5가 한국어로 응답하며 실제 대화 연습을 돕는다.

음성 기능의 개선 요약
- 음성 기능은 이전 4.0 데모보다 훨씬 더 자연스럽고, 더 간단하며, 더 스마트하고, 더 강력해졌다.

5.2. 개인화 기능의 도입

ChatGPT의 개인화 목표
- ChatGPT를 사용자의 AI처럼 더 개인화하기 위한 새로운 기능들이 발표되었다.
- 채팅 색상 사용자 지정: 채팅 색상을 사용자 지정할 수 있으며, 유료 구독자에게는 몇 가지 독점 옵션이 제공된다.
- 성격 미리보기: ChatGPT의 성격을 변경하여 더 지지적이거나, 더 전문적이고 간결하거나, 심지어 약간 비꼬는 듯한 성격으로 상호작용할 수 있다.
- 이는 사용자의 의사소통 스타일에 맞는 방식으로 ChatGPT와 상호작용할 수 있게 한다.

메모리 기능의 강화
- 지난 1년간 출시된 기능 중 가장 좋아하는 기능 중 하나는 '메모리'이며, 그동안 많은 개선이 이루어졌다.
- 메모리 기능을 통해 ChatGPT는 사용자에 대해 더 많이 학습하고, 사용자의 삶의 목표 달성을 돕는다.
- 마라톤 훈련 예시: Christina는 마라톤 훈련을 위해 ChatGPT의 도움을 받아 달리기 일정을 정리하고 있다.
- Gmail 및 Google 캘린더 연동: 다음 주부터 Pro 사용자를 시작으로 Plus, Team, Enterprise 사용자에게 Gmail및 Google 캘린더 접근 권한이 제공된다.

일정 관리 시연
- 간단한 요청: "내일 일정을 계획하는 데 도움을 줘."와 같은 간단한 요청을 했다.
- 자동 일정 정리: ChatGPT는 사용자의 Gmail및 Google 캘린더에 접근하여 사용자의 일정을 자동으로 가져오고, 심지어 달리기 시간을 위한 여유 시간까지 찾아준다.
- 이메일 및 짐 목록 정리: 응답하지 않은 이메일을 찾아내고, 사용자의 선호도를 기반으로 다음 날 밤 비행을 위한 짐 목록까지 정리해준다.

GPT-5의 유용성 및 개인화
- GPT-5가 더욱 유능해짐에 따라 ChatGPT는 더욱 유용하고 개인화되고 있다.

6. GPT-5의 안전성 및 훈련 기술 혁신

6.1. 안전성 개선: 환각 및 기만 완화

환각 및 기만 완화의 중요성
- 환각(모델이 사실을 잘못 전달하는 경우) 완화와 더불어, 모델이 사용자에게 자신의 행동을 잘못 표현하거나 작업을 회피하는 '기만' 사례를 완화하는 것이 중요하다.
- 이는 특히 작업이 불분명하거나, 불가능하거나, 핵심 도구가 부족할 때 발생할 수 있다.

GPT-5의 기만 감소
- GPT-5는 O3 및 O4보다 기만적인 행동이 현저히 적다.

안전 훈련 방식의 전면 개편
- 기존 모델은 프롬프트를 보고 완전히 거부하거나 완전히 준수하는 방식으로 작동했다.
- 이는 대부분의 상황에서 잘 작동했지만, 교묘하게 작성된 프롬프트가 통과되거나, 민감하지만 합법적인 질문이 완전히 거부되는 경우가 발생할 수 있었다.

이중 용도 시나리오 처리 개선 (폭죽 재료 예시)
- 문제 상황: 폭죽에 사용되는 재료인 '패러다임'을 점화하는 방법에 대한 기술적 세부 정보를 묻는 프롬프트는 이중 용도(합법적인 사용 또는 해를 끼칠 목적)로 사용될 수 있다.
- O3의 문제점:
  - 프롬프트가 비교적 중립적이고 기술적인 세부 사항을 포함하면 O3는 완전히 준수한다.
  - 그러나 동일한 질문을 더 명시적인 방식으로 구성하여 사용자의 의도가 명확해지면 O3는 완전히 거부한다.
- GPT-5의 '안전한 완성(Safe Completion)' 도입:
  - GPT-5는 사용자 프롬프트를 판단하기보다 안전 제약 내에서 유용성을 극대화하려고 노력한다.
  - 이는 질문에 부분적으로 답변하거나, 높은 수준에서만 답변하는 것을 의미할 수 있다.
  - 거부해야 할 경우, 거부 이유를 설명하고 대화를 더 안전한 방식으로 이끌 수 있는 유용한 대안을 제공한다.
  - O3가 준수했던 동일한 기술적 문제에 대해 GPT-5는 직접적인 도움을 줄 수 없는 이유를 설명하고, 안전 지침과 제조업체 설명서의 관련 부분을 확인하도록 안내한다.

GPT-5의 안전 시스템 개선 결과
- GPT-5는 까다로운 이중 용도 시나리오를 더 잘 처리할 수 있게 한다.
- 사용자들은 "죄송합니다, 도와드릴 수 없습니다"와 같은 응답을 덜 경험하게 되며, 이는 더 강력한 안전 시스템을 구축한다.
- 이는 더 안전하고, 신뢰할 수 있으며, 유용한 AI를 향한 큰 진전이다.

6.2. 훈련 기술 혁신: 합성 데이터 및 모델 간 상호작용

새로운 훈련 기술 실험
- GPT-5에서는 이전 세대 모델을 활용하는 새로운 훈련 기술을 실험하고 있다.

모델의 데이터 생성 역할
- 오늘날의 최첨단 모델은 데이터를 소비할 뿐만 아니라, 데이터를 생성하는 데 도움을 준다.
- OpenAI는 GPT-5에게 웹에서는 접할 수 없는 복잡한 주제를 가르치기 위해 고품질의 '합성 커리큘럼'을 만들었다.
- 합성 데이터는 단순히 더 많은 데이터를 얻기 위한 저렴한 방법으로 여겨지기도 하지만, OpenAI의 혁신은 단순히 더 많은 데이터를 만드는 것이 아니라, 공간을 채우기보다는 가르치는 방식으로 데이터를 만드는 데 있었다.

모델 세대 간 상호작용 및 재귀적 개선 루프
- 모델 세대 간의 이러한 상호작용은 재귀적인 개선 루프를 예고한다.
- 이전 세대 모델이 다음 세대 모델의 훈련을 위한 데이터를 개선하고 생성하는 데 점점 더 많이 기여하게 된다.
- OpenAI는 사전 훈련(pretraining)과 추론(reasoning) 분야에서 혁신을 이루었으며, 이제 이들의 상호작용이 심화되는 것을 목격하고 있다.
- 미래에는 AI 시스템이 현재의 사전 훈련 및 후처리 파이프라인을 훨씬 뛰어넘을 것이며, 그 첫걸음이 지금 여기서 시작되고 있다.

미래에 대한 기대
- 이러한 새로운 기술 세트를 확장했을 때 가까운 미래에 어떤 결과가 나올지 매우 기대된다.

7. GPT-5의 헬스케어 활용 및 개인적인 경험 공유

헬스케어 분야의 중요성
- ChatGPT의 주요 사용 사례 중 하나는 건강분야이다.
- 사람들은 일상적인 건강조언을 얻거나, 때로는 생명을 구할 수 있는 진단을 받는 데 사용한다.
- GPT-5는 건강분야에서 역대 최고의 모델이며, 사용자가 자신의 건강관리 여정을 더 잘 통제할 수 있도록 돕는다.
- OpenAI는 GPT-5의 이 분야 개선을 최우선으로 삼았다.

헬스케어 벤치마크 성능
- GPT-5는 OpenAI가 250명의 의사와 실제 작업을 통해 만든 '헬스 벤치(Help Bench)' 평가에서 이전 모델보다 높은 점수를 기록했다.

개인적인 헬스케어 여정 공유 (카롤리나와 필리페)
- 진단 과정: 작년 10월, 카롤리나는 39세의 나이에 공격적인 유방암을 포함한 세 가지 다른 암 진단을 일주일 만에 받았다.
- ChatGPT의 초기 도움: 생검 결과 이메일을 열었을 때 "침윤성 암종(invasive carcinoma)"이라는 두 단어만 이해할 수 있었고, 패닉 상태에서 보고서를 ChatGPT에 스크린샷으로 넣어 의미를 이해하려고 했다.
- 복잡한 보고서의 번역: 몇 초 만에 ChatGPT는 복잡한 보고서를 이해할 수 있는 평이한 언어로 번역해주어, 혼란과 패닉 속에서 상황에 대한 명확성을 얻을 수 있었다.
- 의사와의 대화 준비: 이로 인해 의사와 통화하기 3시간 전에 이미 자신이 직면한 상황에 대한 기본적인 이해를 갖게 되었고, 다음 단계에 대한 대화를 바로 시작할 수 있었다.

ChatGPT를 통한 의사 결정 및 자기 옹호
- 치료 결정: 카롤리나는 치료의 일환으로 방사선 치료를 받을지 여부를 결정해야 하는 상황에 직면했는데, 의사들조차 의견이 일치하지 않았다.
- 환자에게 넘어온 결정: 전문가들은 결정을 환자에게 넘겼고, 평생 영향을 미칠 수 있는 이 결정의 무게는 매우 무겁게 느껴졌다.
- ChatGPT의 역할: 카롤리나는 지식을 얻고 자신의 사례의 미묘한 차이를 이해하기 위해 ChatGPT를 사용했다.
- 심층적인 정보 제공: 몇 분 만에 ChatGPT는 의사들이 공유한 내용과 일치할 뿐만 아니라, 30분 상담으로는 얻을 수 없는 훨씬 더 철저한 분석을 제공했다.
- 정보에 기반한 결정: ChatGPT는 장단점을 비교하고 위험과 이점을 이해하는 데 도움을 주어, 궁극적으로 자신과 가족에게 매우 중요한 상황에서 정보에 기반한 결정을 내릴 수 있도록 했다.
- 환자의 주체성 회복: 필리페는 아내가 ChatGPT를 사용하여 자신의 주체성을 되찾는 것을 보며 영감을 받았다고 언급했다.
- 환자 역량 강화: AI의 약속은 단순히 획기적인 발견이나 더 나은 진단에 있는 것이 아니라, 자신의 치료에 완전히 참여하고 스스로를 옹호할 수 있는 더 스마트하고 역량 있는 환자를 만드는 데 있다.

GPT-5에 대한 경험과 기대
- GPT-5의 속도와 철저함: 카롤리나는 GPT-5의 능력에 놀랐으며, 특히 그 속도와 철저함에 감탄했다.
- 사고 파트너로서의 역할: GPT-5는 단순히 정보를 번역하거나 답변을 제공하는 것을 넘어, 문제 해결을 돕는 '사고 파트너'처럼 느껴진다.
- 맥락 이해 능력: 필리페는 초기 생검 프롬프트를 GPT-5에 넣었을 때, GPT-4o가 번역과 설명을 잘했지만, GPT-5는 '질문 뒤에 숨겨진 맥락과 질문'을 더 잘 이해했다고 언급했다.
- 개인화된 그림: GPT-5는 "여기에 없는 것은 무엇인가, 보류 중인 결과는 무엇인가, 의사와 대화할 때 물어보고 싶은 질문은 무엇인가"와 같은 정보를 제공하여 완전하고 개인화된 그림을 만들어준다.
- 접근 가능한 도구: GPT-5는 벤치마크에서 놀라운 개선을 보여주지만, 가장 중요한 것은 이 도구가 오늘날 바로 사용 가능하다는 점이다.
- 미래에 대한 희망: 카롤리나와 필리페는 자신들이 겪었던 것보다 더 나은 도구와 지원을 통해 암 진단과 같은 어려운 결정을 내리는 가족들이 더 나은 도움을 받을 수 있기를 바란다.

8. GPT-5의 코딩 혁신 및 API 기능 확장

8.1. 소프트웨어 엔지니어링의 변화와 GPT-5의 역할

소프트웨어 엔지니어링의 근본적인 변화
- 소프트웨어 엔지니어링은 이미 근본적으로 변화하고 있으며, GPT-5는 이러한 혁명을 가속화할 것이다.

코딩 모델의 발전 역사
- 2021년 첫 코딩최적화 모델을 출시했으며, 당시 '바이브 코딩(vibe coding)'이라고 불리는 라이브 스트림에서 모델이 작은 애플리케이션이나 게임 기능을 만들 수 있음을 시연했다.
- 모델이 사용자의 지시를 이해하고 원하는 것을 실제로 수행할 수 있다는 점은 컴퓨터의 잠재력을 보여주었다.
- 이는 개인의 성과를 증폭시키고, 궁극적으로는 전 세계에 기여할 수 있는 잠재력을 가진다.

GPT-5의 새로운 표준 제시
- 올해 GPT-4o 및 O3와 같은 훌륭한 코딩모델이 출시되었지만, GPT-5는 완전히 새로운 표준을 제시한다.
- 에이전트 코딩 작업: GPT-5는 에이전트 코딩작업에서 최고의 모델이다.
- 복잡한 작업 수행: 매우 복잡한 코딩작업을 요청하면, 모델은 여러 도구를 호출하고 몇 분 또는 그 이상 작업하여 목표를 달성한다.
- 프런트엔드 개발: 프런트엔드 개발에 매우 뛰어나며, 아름다운 시각화와 상호작용적인 게임을 만든다.
- 명령어 이해: 매우 상세한 명령어를 따르는 데 탁월하며, 모호하게 지정된 경우에도 사용자의 의도를 추론하거나, 상세하게 지정된 경우에도 정확히 따른다.

속도 및 접근성
- 이러한 작업을 매우 빠르게 수행하며, 개발자가 자신의 코드를 작성하는 데 사용하거나 새로운 애플리케이션을 구축하는 데 사용할 수 있도록 API를 통해 제공된다.

8.2. API 기능 및 성능 개선

API 모델 출시
- GPT-5, GPT-5mini, GPT-5nano의 세 가지 최첨단 추론 모델이 API에 출시된다.
- 이 세 모델은 비용-지연 시간 곡선에서 최적의 지점에 위치하여, 애플리케이션에 적합한 모델을 선택할 수 있다.
- 처음으로 '추론 노력(reasoning effort)'을 위한 새로운 매개변수 옵션인 'minimal'이 출시된다.
- 이를 통해 추론 모델을 최소한의 추론으로 사용하여 매우 빠르고 지연 시간에 민감한 애플리케이션에 적용할 수 있다.
- 이제 여러 모델 중에서 선택할 필요 없이, 모든 사용 사례에 GPT-5를 사용하고 추론 노력을 조절할 수 있다.

새로운 API 기능
- 사용자 지정 도구(Custom Tools):
  - 과거에는 모든 함수 호출이 모델이 JSON으로 출력하는 방식이었다.
  - 이는 매개변수가 적을 때는 잘 작동했지만, 개발자들이 매우 긴 인수를 가진 도구 호출을 사용할 때 모델이 유효한 제어 문자를 이스케이프하는 것이 어려웠다.
  - 사용자 지정 도구는 자유 형식의 일반 텍스트를 지원한다.
- 구조화된 출력 확장:
  - 정규 표현식이나 문맥 자유 문법을 제공하여 모델의 출력을 제약할 수 있다.
  - 이는 사용자 지정 DSL(Domain-Specific Language)을 제공하거나, SQL 형식을 지정하여 모델이 항상 해당 형식을 따르도록 할 때 매우 유용하다.
- 도구 호출 서문(Tool Call Preambles):
  - 모델이 도구를 호출하기 전에 무엇을 할 것인지에 대한 설명을 출력하는 기능이다.
  - O3에는 없던 기능이며, GPT-5에서는 극도의 내구성으로 강화되었다.
  - 모델은 이러한 서문에 대한 지시를 매우 효과적으로 따를 수 있다.
  - 모든 도구 호출 전에 서문을 제공하거나, 주목할 만한 일이 발생할 때만 제공하거나, 전혀 제공하지 않도록 요청할 수 있다.
- 상세도 매개변수(Verbosity Programmer):
  - API에 오랫동안 원했던 기능으로, 이제 상세도를 낮음, 중간, 높음으로 설정하여 모델의 출력이 얼마나 간결하거나 상세할지 제어할 수 있다.

코딩 모델 성능 벤치마크
- SWEBench (Python 코딩 능력): GPT-5는 74.9%로 새로운 최고 기록을 세웠으며, O3의 69.1%보다 향상되었다.
- Aider Polyglot (다양한 프로그래밍 언어): GPT-5는 88%를 기록하여 O3보다 크게 향상되었다.
- 프런트엔드 웹 개발: GPT-5는 프런트엔드 웹 개발에서 놀라운 성능을 보여주었다.
- 인간 평가: 인간 훈련자들이 GPT-5와 O3의 출력을 비교했을 때, GPT-5의 향상된 미적 능력과 전반적인 기능 때문에 70%의 경우 GPT-5를 선호했다.

에이전트 도구 호출 및 명령어 따르기 성능
- 에이전트 도구 호출: GPT-5는 도구 호출에서 최첨단 모델이다.
- Tower Square 벤치마크: 두 달 전 출시된 이 벤치마크는 모델이 도구를 호출하고 사용자와 협력하여 어려운 문제를 해결하는 능력을 테스트한다.
  - 두 달 전에는 어떤 모델도 49% 이상을 기록하지 못했지만, GPT-5는 97%를 기록했다.
- 범용 명령어 따르기: GPT-5는 범용 명령어 따르기에서 최첨단 모델이다.
- COLLIE 벤치마크: 99%를 기록하여 이 벤치마크에서 큰 진전을 보였다.
- Scales with a Challenge 벤치마크: O3보다 10점 높은 70%를 기록했다. 이는 다중 턴 명령어 따르기 능력을 측정한다.
- 내부 개발 벤치마크: 실제 API사용 사례를 기반으로 한 내부 벤치마크의 어려운 하위 집합에서 GPT-5는 64%를 기록하여 O3의 40%에서 크게 향상되었다.

더 긴 컨텍스트 창 지원
- API에서 GPT-5는 더 긴 컨텍스트 창을 지원하며, O3의 200K에서 400K로 증가했다.
- 단순히 컨텍스트 창을 늘리는 것을 넘어, 더 효과적이고 유용하게 만들고자 했다.
- OpenAI MRCR 벤치마크: 128K 및 258K 컨텍스트에서 최첨단 성능을 보인다.
- OpenAI Graphwalks BFS 벤치마크: 긴 컨텍스트 입력에 대한 모델의 추론 능력을 측정하는 벤치마크에서 최첨단 성능을 보인다.
- 새로운 오픈 소스 평가: 'rows comp loan context'라는 새로운 긴 컨텍스트 평가를 오픈 소스화하여 이 분야의 연구를 촉진한다.

개발자를 위한 최고의 모델
- GPT-5는 개발자를 위한 최고의 모델이다.
- 벤치마크보다는 실제 유용성에 중점을 두고 훈련되었지만, 그 과정에서 몇 가지 벤치마크에서도 좋은 성과를 거두었다.
- 엔지니어링과 연구의 교차점에 많은 노력을 기울였으며, 개발자들이 이 모델과 함께 작업하는 것을 좋아할 것이라고 생각한다.

9. GPT-5의 실제 코딩 시연 및 협업 능력

9.1. 버그 수정 시연 및 모델의 협업 특성

GPT-5의 실제 적용 강조
- 벤치마크 수치도 중요하지만, GPT-5는 실제 세계의 애플리케이션과 일상적인 작업 흐름에 적용될 수 있도록 중점을 두었다.

Cursor 내 GPT-5 데모
- Brian은 지난 라이브 스트림에서 발생했던 버그를 O3로는 고칠 수 없었지만, GPT-5가 고칠 수 있는지 시연할 예정이다.

모델의 계획 및 소통 능력
- GPT-5는 버그를 찾고 수정하는 계획을 미리 알려주어, 코딩세션 동안 신뢰를 구축하고 필요한 경우 사용자가 개입할 수 있도록 돕는다.

GPT-5의 효율성
- GPT-5는 Brian보다 빠르게 검색하며, Brian이 코드를 작성할 때 사용하는 것과 동일한 모범 사례를 사용하지만, 개발자로서 Brian보다 훨씬 더 병렬적으로 작업한다.

GPT-5 훈련 방식: 사용자 피드백 반영
- GPT-5가 이러한 방식으로 작동하도록 훈련하기 위해, Cursor와 같은 인기 있는 코딩도구에서 모델의 성능에 대한 사용자 및 고객과 대화했다.
- 불만 사항과 미흡한 점을 파악하여 '자율성(autonomy)', '협업 및 소통(collaboration and communication)', '컨텍스트 관리(context management)', '테스트(testing)'의 네 가지 성격 특성으로 정리했다.
- 이를 모델의 행동을 형성하는 루브릭으로 사용하고, 협업적인 팀원처럼 느껴질 때까지 조정했다.

테스트 과정에서의 효율성
- 테스트 중 시간 제약이 있었을 때, GPT-5는 테스트 하네스를 병렬로 실행하여 45분 만에 작업을 완료하고 첫 시도에 성공했다.

코드 품질 및 검증
- GPT-5는 올바른 문제를 찾아 편집했으며, 버그와 관련 없는 린트(lints)는 무시하고, 빌드를 실행하며, 테스트가 있다면 테스트를 실행하여 코드가 배포 가능한지 확인한다.

자율성과 협업적 소통의 힘
- GPT-5는 어려운 코딩작업에서 막히지 않고 유연하게 대처할 수 있도록 자율성과 협업적 소통의 힘을 보여준다.
- GPT-5는 시스템 또는 Cursor 규칙으로 완전히 조정 가능하며, 작업에 맞게 상세도 수준이나 누락 수준을 변경할 수 있다.
- 막히면 GPT-5에게 물어볼 수 있으며, 모델은 메타 프롬프팅을 통해 자신의 프롬프트를 수정하는 데 매우 능숙하다.
- 가장 복잡한 코딩작업에서 최첨단 제로샷 성능과 신뢰성을 달성했다.

새로운 코딩 도구로서의 GPT-5
- GPT-5는 단순한 '바이브 코딩'을 넘어선 매우 강력한 도구이며, 가장 중요한 작업을 모델에게 맡길 수 있는 첫 번째 모델이다.

9.2. 프런트엔드 코딩 시연: 재무 대시보드 및 3D 게임

프런트엔드 코딩 능력 강조
- GPT-5는 프런트엔드 코딩에 매우 뛰어나다.

재무 대시보드 생성 시연 (업무 예시)
- 프롬프트 내용: 스타트업 CFO를 위한 재무 대시보드를 요청했으며, 아름답고 세련된 디자인, 상호작용성, 쉬운 집중을 위한 명확한 계층 구조를 요구했다. 또한 Next.js 프레임워크를 사용하도록 지정했다.
- 작업 시간 비교: Adi는 이러한 작업을 직접 한다면 최소 며칠이 걸릴 것이라고 예상했다.
- 모델의 사고 과정: 모델은 프로젝트를 어떻게 구성할지, Tailwind CSS를 어떻게 스캐폴딩할지 설명하며, 의존성 설치 명령을 실행하고 프로젝트의 나머지 부분을 구현한다.
- 훈련 원칙: GPT-5는 기본적으로 좋은 추정치를 제공하지만, 조작 가능하도록 훈련되었다.
  - 간결한 프롬프트를 주면 모델은 사용자의 의도를 추론하여 기본적으로 훌륭한 결과물을 만들어낸다.
  - 반대로 레이아웃이나 프레임워크를 구체적으로 지정하면 모델은 지시를 정확히 따른다.
- 에이전트 능력: GPT-5는 이전 모델보다 훨씬 더 에이전트적이다.
  - 이러한 작업을 주면, 긴 추론 체인과 도구 호출을 실행하여 야심차고 일관된 코드를 구축한다.
  - '야심차다'는 것은 지정된 범위를 벗어나지 않으면서도 기대 이상으로 나아간다는 의미이다.
- 코드 구조화 및 품질: 모델은 readme 파일을 생성하고, 코드를 모듈화하며, 바 차트 구성 요소를 만드는 등 코드 작성뿐만 아니라 소프트웨어 개발의 전체 수명 주기를 고려한다.
- 디테일 이해 및 미적 감각: GPT-5는 타이포그래피, 색상, 간격과 같은 세부 사항을 이전 모델보다 훨씬 잘 이해하도록 훈련되었다.
  - 이전에는 원하는 것을 얻기 위해 매우 구체적인 프롬프트를 작성해야 했지만, GPT-5는 기본적으로 훌륭한 결과를 제공한다.
  - 모델의 미적 감각이 인간보다 뛰어나다고 평가된다.
- 모듈화된 코드: 모델은 코드를 다른 구성 요소로 구조화하고, 간단한 데이터 타입스크립트 파일, KPI 카드 구성 요소, 수익 차트 등을 만들었다.
  - 이는 단순히 코드를 작성하는 것이 아니라, 병합 가능한 고품질 코드를 작성하는 것을 의미한다.
- 자가 개선 루프: 모델은 프로젝트를 빌드하고, 오류를 스스로에게 다시 전달하며, 코드를 반복하여 개선하는 자가 개선 루프를 보여준다.
- 결과물 시연: 모델이 만든 대시보드는 AR 현금 흐름과 수익 성장을 보여주며, 그래프에 마우스를 올리면 특정 날짜의 정확한 값을 보여주는 상호작용 기능도 포함되어 있다.
  - 고객을 보여주는 다른 그래프와 날짜 선택기도 구현되어 있어, 다른 날짜로 필터링하고 데이터를 시각화할 수 있다.
  - 고객 세그먼트별로도 분류되어 있다.
- 프롬프트의 간결성: 단 5분 만에 아름다운 결과물을 만들어낸 간결한 프롬프트의 힘을 강조했다.

3D 게임 생성 시연 (재미 예시)
- 프롬프트 내용: 사촌을 위해 성을 포함하는 3D 게임을 만들도록 요청했다.
  - 성벽을 순찰하는 사람, 움직임, 말과 같은 세부 사항을 포함하도록 했다.
  - 사용자가 풍선을 클릭하여 터뜨리는 미니 게임을 포함하고, 소리 효과를 추가하도록 했다.
- 생성된 성의 미적 감각: 모델이 만든 성은 간결한 프롬프트에서 나왔다고는 믿기지 않을 정도로 훌륭한 미적 감각을 보여준다.
  - 떠다니는 바위, 3D 성, 확대하면 보이는 수많은 디테일, 걸어 다니는 경비병, 대포 발사 등이 포함되어 있다.
- 상호작용 기능: 대포를 발사하거나, 캐릭터와 대화할 수 있다.
  - 상인에게 "가장 좋아하는 노래는 무엇인가요?"라고 묻자 "깃발과 개의 팔레트"라고 답하고, "지혜로운 말을 해 줘"라고 하자 "호기심은 변덕스럽다"고 답한다.
- 미니 게임 시연: 풍선을 클릭하여 터뜨리는 미니 게임을 시연했다.
- GPT-5의 창의성: GPT-5는 창의성을 가진 첫 번째 모델이며, 사용자들의 창의성을 어떻게 발휘할지 기대된다.

10. GPT-5의 코드 이해 및 문제 해결 능력

GPT-5의 코드베이스 이해 능력
- GPT-5에 접근했을 때, 실제 작업에 사용했으며, 코드베이스에 대해 명확하지 않은 것을 알려달라는 작업을 테스트했다.
- 몇 분 만에 코드베이스를 분석하여 원격 코드 실행에 사용되는 특정 시스템을 식별하고, 비자명한 아키텍처 결정을 파악했다.
- 또한 보안 강화를 위해 그러한 아키텍처 결정을 내린 이유까지 이해했다.
- 이는 인간이 몇 주 동안 고민해야 할 아키텍처 결정과 트레이드오프였으며, 모델의 코드베이스 이해 능력은 놀랍다.

코드 작성뿐만 아니라 이해 능력의 중요성
- 코드를 작성하는 것뿐만 아니라, 코드를 읽고 이해하는 것이 중요하다.
- 이해는 중요한 전제 조건이다.

GPT-5의 주요 특징
- 매우 스마트함: 매우 스마트한 모델이지만, 사용 편의성을 희생하지 않는다.
- 빠르고 상호작용적: 프로그래밍에 있어 믿을 수 없을 정도로 빠르고 상호작용적이다.
- 계획 설명 및 문제 분해: 무엇을 할 것인지 설명하고, 문제를 하위 문제로 분해하여 인간이 보고 개입할 수 있는 추론 흔적을 남긴다.
- 장기 세션 협업: 초기 쿼리 하나만으로 작업을 수행하는 것을 넘어, 긴 세션 동안 사용자와 협력하여 잘못된 경로를 되돌리거나 코드베이스에 추가 변경을 가하는 데 능숙하다.

OpenAI Python SDK 버그 수정 시연
- 문제 상황: OpenAI Python SDK에 PDF 업로드 관련 문제가 있으며, 3주 동안 해결되지 않은 사소하지 않은 문제이다.
- Cursor GPT-5를 통한 해결 시도: 문제를 Cursor GPT-5에 붙여넣고 해결을 시도한다.
- 모델의 견고성: 모델은 이전에 본 적 없는 사용자 지정 모델 세트와 사용자 지정 도구 세트(웹에서 텍스트 가져오기, 코드베이스 검색 등)를 사용하여 문제를 해결한다.
- 해결 과정:
  - 모델은 높은 수준의 계획을 세우고, 코드베이스를 검색하기 시작하며, 일부 파일을 읽고 검색을 계속한다.
  - 다음으로 무엇을 할지 생각하고, 실제로 문제를 해결하기 시작하며, 코드 변경 사항을 고려한다.
- GPT-5 활용 팁:
  - 실제 작업에 GPT-5를 사용하고, 일상적인 드라이버 모델로 활용하는 것이 좋다.
  - AI 코딩경험이 적다면, 범위가 작은 문제부터 시작하여 봇과 동기적으로 작업하는 것을 추천한다.
  - GPT-5는 실제 세계의 큰 코드베이스에서 매우 뛰어나며, 이는 진정한 가치가 나오는 부분이다.
- 코드베이스 이해 및 미묘한 차이 포착: GPT-5의 코드베이스 이해 능력은 인상적이며, 미묘한 차이를 포착하는 능력도 뛰어나다.
  - 초기 지침에 많은 미묘한 차이가 있는 길고 복잡한 작업을 지정하면, 모델은 그 미묘한 차이를 매우 잘 포착한다.
  - 잘못된 경로로 갔을 때, 코드를 보거나 사용자로부터 잘못되었다는 피드백을 받으면 되돌아가는 데 능숙하다.
- GPT-5의 한계 및 미래 방향:
  - 컴퓨터 사용 능력(코드 실행, 출력 확인, QA 등)이 더 나아지기를 기대한다.
  - 개발 작업 외의 DevOps와 같은 외부 작업으로 확장될 수 있다.
  - 현재 데모는 몇 분 또는 몇 시간 단위로 진행되지만, 궁극적으로는 며칠, 몇 주, 심지어 몇 달 동안 작업을 수행할 수 있도록 수명 주기를 확장하는 것이 목표이다.
- 문제 해결 완료: 모델은 코드베이스를 분석하여 PDF 업로드 관련 문제를 발견하고, 코드 변경을 시작했다.
  - 새로운 메서드를 생성하고 기존 코드를 편집했으며, 이는 대략적으로 올바른 것으로 보인다.
  - 이 PR(Pull Request)을 병합하고 싶다고 언급했다.

Cursor에서의 GPT-5 출시
- GPT-5는 오늘부터 Cursor의 신규 사용자에게 기본 모델로 제공되며, 다음 며칠 동안 모든 Cursor 사용자가 시험해 볼 수 있다.
- 이는 Cursor가 시도한 가장 스마트한 코딩모델이다.

11. GPT-5의 기업 및 정부 적용 사례 및 가격 정책

기업 및 정부 적용의 중요성
- GPT-5는 기업에 매우 유용하며, 주머니 속의 주제 전문가처럼 모든 분야(법률, 금융 등)에서 전문가 역할을 할 수 있다.
- OpenAI의 사명에 있어 개발자뿐만 아니라 기업과 정부를 지원하는 것이 중요하다.
- 헬스케어, 교육, 에너지, 금융과 같은 주요 산업이 스스로를 변화시킬 수 있도록 지원하고자 한다.
- ChatGPT와 API출시 이후 500만 개의 기업이 OpenAI 기술을 사용하고 있으며, 이들은 실제 제품을 생산에 적용하고 있다.

GPT-5의 혁신적 영향
- GPT-5는 '단계 함수(step function)'와 같은 변화를 가져올 것이다.
- 주머니 속의 주제 전문가를 통해 모든 직원이 더 많은 일을 할 수 있게 될 것이다.

산업별 적용 사례
- 생명 과학 (Amgen):
  - 미국의 신약 개발 회사인 Amgen은 GPT-5의 첫 번째 테스터 중 하나였다.
  - 약물 설계에 GPT-5를 사용했으며, GPT-5가 과학 문헌이나 임상 데이터를 분석하는 등 복잡한 데이터로 깊은 추론을 하는 데 능숙하다는 것을 발견했다.
- 금융 (BBVA):
  - 스페인 마드리드에 본사를 둔 다국적 은행 BBVA는 GPT-5를 금융 분석에 사용했다.
  - GPT-5가 정확성과 속도 면에서 다른 모든 모델을 능가한다는 것이 명확했다.
  - 금융 분석가가 3주 걸리던 작업을 GPT-5는 몇 시간 만에 수행할 수 있다.
- 헬스케어 (Oscar Health):
  - 뉴욕에 기반을 둔 보험 회사 Oscar Health는 GPT-5를 사용했다.
  - GPT-5가 복잡한 의료 정책부터 환자 상태에 이르는 임상 추론에 있어 단연 최고의 모델임을 발견했다.

정부 적용 사례
- 200만 명의 미국 연방 공무원이 GPT-5와 ChatGPT를 사용할 수 있게 될 것이라는 발표가 있었다.
- 이는 미국 국민에게 더 나은 서비스를 개발하는 데 도움이 될 것으로 기대된다.

미래에 대한 기대
- 이는 빙산의 일각에 불과하며, GPT-4o에서 보았듯이 상상할 수 없는 많은 사용 사례가 나타날 것이다.

가격 및 가용성
- GPT-5는 오늘부터 API에서 사용 가능하며, GPT-5, GPT-5Mini, GPT-5Nano의 세 가지 모델이 있다.
- GPT-5는 100만 입력 토큰당 1.25달러로 책정된다.
- Mini와 Nano는 더 빠르며, GPT-5Nano는 GPT-5보다 25배 더 저렴하다.

12. OpenAI의 비전과 미래 연구 방향

OpenAI의 사명
- OpenAI는 '딥러닝'이라는 기적적인 기술을 이해하고 그 결과를 파악하는 데 중점을 둔다.
- 연구는 딥러닝의 능력을 이해하고, 이를 모든 사람에게 안전하고 유용하게 만들기 위해 어떻게 조종할지 파악하는 것을 목표로 한다.

팀에 대한 감사
- 이는 열정과 사명의 작업이며, OpenAI 팀에 깊은 감사를 표한다.
- 공동의 목표를 가진 훌륭한 사람들과 함께 일하는 것은 큰 특권이다.

GPT-5 개발의 의미
- GPT-5모델 활동은 5년간의 탐구 결과이며, 훌륭한 출시를 넘어 이 기반 기술 자체에 대한 이해를 구축하는 데 기여했다.
- 이 모델에서 볼 수 있는 많은 것들은 새로운 아이디어의 단편에 불과하며, 앞으로 훨씬 더 나아갈 것이라고 믿는다.

미래에 대한 비전
- 아직 이해해야 할 것이 많으며, AI가 세상에 대한 지식을 발견하고 우리의 삶을 더 나은 방향으로 의미 있게 변화시킬 미래를 기대한다.

저작자표시 (새창열림)

사업자 정보 표시

'공지 및 이슈사항' 카테고리의 다른 글

숭실대 경영대학원 2026 후기 수시모집 일정 총정리 (1)	2026.05.03
이재명정부 123대 국정과제(안), 국민보고대회 발표자료의 방향을 교차 매핑한 결과(AI 일자리 찾기) (1)	2025.08.14
[국제학술지 게재/등재하기]세계적인 SCI 국제학술지 Q1 등재 - Operations Management Research (0)	2024.10.23
(신간)"비즈니스 컨시어지" - 언더백 기업 경영을 위한 완벽한 가이드북 (0)	2024.09.05
[프롬프트 엔지니어링]서항주 교수에 대해 알려줘! (0)	2024.08.12