2025년 4월, OpenAI는 GPT-5 아키텍처 기반의 새로운 모델인 o3을 공개했습니다. 이 모델은 기존 4o와 비교해 이미지 처리에서 추론 능력이 강화된 점이 특징입니다. 사진 속 간판, 구조물, 배경 등을 분석해 장소나 상황을 유추할 수 있으며, 기존 모델보다 더 복잡한 이미지도 해석할 수 있습니다.
GPT-4o와 o3의 차이점
GPT-4o 역시 이미지 분석 기능을 제공했지만, 이는 image 속 텍스트를 읽거나 단순한 사물 설명에 가까웠습니다.
반면 o3는 다음과 같은 차이점을 가집니다.
- 흐릿한 이미지나 왜곡된 정보에 대한 분석 능력
- 간접적인 단서를 활용해 장소, 브랜드, 맥락까지 추론
- 웹 검색 기능과 결합, 실시간 정보 기반으로 분석
즉, o3는 텍스트 없이 시각적 단서만으로 장소 유추 가능한데요. '이해'를 넘어 '맥락을 파악하고 결론은 도출하는 추론 모델'입니다.
어떻게 사용할 수 있을까?
o3는 시각적 특징 간판, 메뉴, 건물 양식 등을 바탕으로 웹 검색 + 이미지 추론을 결합하여 분석합니다.
GPS, 메타데이터 없이도 "이 장소는 어디처럼 보인다"라는 식으로 추론하게 됩니다. 즉 AI가 실제로 '시각적 유추'를 하는 것입니다.
물론, 4o도 image 분석을 통해 유사하게 정답에 접근할 수도 있습니다. 다만, 상대적으로 제한된 추론 기능이 사용됩니다.
현재 이 기능은 무료 사용자가 아닌 유료 플랜 구독자 대상으로 지원되고 있습니다.
Plus, Pro 및 Team 구독자라면 모델 선택에서 o3, o4-mini, o4-mini-high를 사용할 수 있습니다.
이전의 o1, o3-mini, o3-mini-high를 대체하며 정식 출시되었습니다.
구분 | 사용 가능 여부 | 비고 |
무료 사용자 | 불가 | 유료 결제 후 사용 가능 |
유료 구독자 | 가능 | Plus, Pro, Team 플랜 구독자 이용 가능 |
해외 사례 중 하나를 보면, 사용자가 어두운 술집에서 찍은 사진 한 장을 업로드했을 때, 사진 속 '보라색 코뿔소 모양의 조명이 있는 인테리어'가 일부 포함되어 있었습니다.
GPT-4o는 이를 '영국의 펍'으로 잘못 인식했지만, o3는 '뉴욕 브루클린 윌리엄스버그 지역의 실제 바'를 정확히 식별했습니다.
메타데이터나 텍스트 정보 없이, 시각적 단서만으로 장소를 유추해 낸 것입니다.
위와 같은 사용자 실 경험은 트위터(현 X)를 통해 어렵지 않게 확인할 수 있습니다.
다만, 장소에 대한 식별 능력이 뛰어나 자칫 SNS에 공유한 이미지를 누군가 악용할 수 있어 문제의 소지도 가지고 있습니다.
챗GPT o3 이미지 추론
저는 현재 Plus 요금제를 구독 중으로 실제 o3 모델을 선택 후, 이미지 추론 기능을 사용해 봤습니다.
1. chat.openai.com에 접속 후 로그인
2. 모델 선택에서 o3 선택
3. 채팅창에 사진 업로드
4. 여기가 어디야? 프롬프트 입력
1분 17초 동안 생각하고 상단에 보이는 대로 답변했습니다. 실제 제가 과거 여행지에서 촬영한 지하철 플랫폼의 모습이었고, 오래된 사진으로 흐릿한 상태였습니다.
o3는 철도 표지판, 기차 번호, 어두운 자주색의 열차를 보고 해당 여행지를 유추했고, 플랫폼과 기둥 등을 참고하여 정확한 지역을 추론해 냈습니다.
특별한 설정 업이 업로드한 사진 하나로 장소를 정확히 유추한 것입니다.
사용 후기
챗GPT o3는 포털사이트의 이미지 검색 기능을 대신할 수 있을 정도로 높은 수준의 추론 능력을 지니고 있습니다.
이러한 성능을 통해 비즈니스, 마케팅, 데이터 리서치 분야에서도 사용할 수 있을 것으로 보입니다.
- 여행 사진이나 콘텐츠에 AI 분석 시도
- 위치 기반 추론 콘텐츠에 관심 있는 크리에이터
- AI가 시각 정보를 어떤 방식으로 처리하는지 경험
다만 답변에 있어 정확도는 image 품질과 정보 밀도에 따라 차이는 보입니다.
예를 들어 공원의 단면을 촬영한 사진의 경우 해당 공원을 유추할 수 있는 정보가 부족해 정확한 답변을 내놓지 못했는데요.
축제장의 연등을 보고 조계사나 봉은사 근처로 유추하거나 울타리의 패턴 대부분을 경복궁 돌담길, 창경궁 산책로 주변으로 답하는 등 다소 아쉬운 점도 있었습니다.
하지만 사진 속 정보를 선택하고 생각하며 분석해 결론에 도출하는 과정자체는 사람이 추론하는 것과 동일해, 정말 놀라웠습니다.
유료 가입 필요
GPT-4o가 이미지를 읽는 수준에 머물렀다면, o3는 그로부터 추론하고 판단까지 내려주는 모델입니다.
AI가 인간처럼 상황을 유추하는 방향으로 진화하는 점에서 이번 업데이트는 주목할 만한 변화라고 생각합니다.
현재 Plus 요금제에 가입하고 있다면, 추가 설정 없이 바로 해당 모델 선택하고 사용할 수 있습니다.
image를 업로드하고 GPT가 어떤 결과를 도출하는지 직접 확인해 보면, 지금 제 글을 빠르게 이해하는데 도움 될 것 같습니다.
만약 월 20달러의 구독료가 부담돼 OpenAI의 기능을 사용하지 못하고 있다면 하단 글 참고해 저렴하게 이용해 보세요.
이제 더 이상 AI는 이미지 생성, 검색, 글의 요약 정도로 활용하는 기호품 같은 존재가 아닙니다.
이제는 새 기능이 나올 때마다 우리가 직접 경험해야 할 생필품 중 하나입니다.
챗GPT 4.5 사용법 유료 가격 4o 비교 후기
최근 인공지능 기술이 빠르게 발전하면서 챗GPT 역시 눈에 띄는 속도로 업그레이드되고 있습니다. 특히, 지난 2월 27일 OpenAI는 기존 모델 GPT-4o를 뛰어넘는 GPT-4.5를 새롭게 선보였는데요. 아쉽게도
stock0901.tistory.com