멀티모달
포스트: 5
Posts
5 posts
GPT-4o 보고 듣고 말하는 멀티모달 AI 챗봇 공개
지난 새벽에 오픈AI에서 새로운 GPT-4o 모델을 공개했다. 여기서 'o'는 '옴니(omni)'로 사전적 의미는 '모든 것'이다. 텍스트, 오디오, 이미지 인식을 모두 통합해 상호작용이 가능한 멀티모달(Multimodal, 다중 모드)이라는 점에서 너무나도 잘 어울리는 네이밍이다. 기존 GPT-4와 어떤 차이가 있을까? 오픈AI가 각종 기능을 시연한 영상에서 가장 눈에 띄는 점은 사용자와 실시간으로 음성을 통해 대화를 주고받는 모습이다. 물론 기존에도 음성 모드를 지원했었지만, 대답 속도가 약 5.4초로 느렸지만, GPT-4o에서는 평균 320ms 안에 답변을 한다. 이는 실제 사람과의 대화 속도와 비슷한 수준이라고 한다. 하.......
![[1년 전 오늘] 250608 인천 무의도 덕점방파제 바다루어낚시 - 장대, 광어](https://img.zoomtrend.com/2026/06/10/1781084366-20250608122254.jpg)
![[CV] [Comi] '終末のハーレム ファンタジア' (종말의 하렘 판타지아) 17권. 그동안 SAVAN에 무슨 일이 있었던 거냐](https://img.zoomtrend.com/2026/06/10/1781084386-ECA484EBA6ACEC9790.jpg)

