텍스트와 음성을 통합한 최신 ChatGPT 업데이트가 어떤 사용 경험 변화를 가져왔는지, 그리고 이것이 새 시리에게 어떤 방향성을 제시하는지 살펴본다.

새로운 ChatGPT 음성 업데이이트 덕분에 챗봇과 상호작용하는 방식이 예전보다 훨씬 유연해졌고, 이는 우리가 앞으로 새 시리(Siri)에서 기대할 수 있는 핵심 기능 중 하나의 예시라고 생각한다.
겉으로 보기에는 OpenAI의 변화가 비교적 작은 것처럼 보일 수 있지만, 이미 이 변화가 ChatGPT 사용 경험을 완전히 바꿔 놓았다고 느끼고 있다.
ChatGPT가 처음 출시됐을 때는 텍스트 전용 서비스였다. 이후 음성 상호작용 기능을 확장하면서 두 가지 변화가 있었다.
첫째, 챗봇이 마치 사람을 흉내 내는 것처럼 느껴지게 만들었다. 이건 그 자체로 하나의 주제이지만, 나는 Dave Winer와 John Gruber의 의견에 동의한다. 챗봇의 목표가 사람을 흉내 내는 것이 되어서는 안 된다는 점이다. (적어도 OpenAI는 친근함을 정확성보다 우선시하던 버전에서는 한발 물러섰다.)
Discover more
Apple
Siri
ChatGPT
computer
iOS
iPhone
macOS
iPhone 수리 서비스
Apple Music 구독
Apple TV 스트리밍 기기
둘째, 사용성이 개선됐다. 적어도 특정 유형의 상호작용에서는, AI에게 말을 걸고 음성으로 답을 듣는 것이 직접 타이핑하고 글을 읽는 것보다 당연히 더 빠르고 편리하다.
하지만 때로는 텍스트와 시각 기반 상호작용이 더 적합한 경우가 있다. 선택지가 생긴 것은 아주 좋았지만, 음성으로 작업의 95%까지 진행해 놓고도, 예를 들어 ChatGPT에게 이미지를 만들어 달라고 요청하는 등의 작업을 위해서는 다시 텍스트로 전환해야 하는 상황은 답답할 수 있었다.
이런 답답함은 특히 두 모드가 완전히 분리되어 있어서, 마치 서로 전혀 다른 두 개의 ChatGPT 모델—하나는 음성, 다른 하나는 텍스트—과 상호작용하는 것처럼 느껴졌기 때문에 더 컸다.
최신 ChatGPT 업데이트는 텍스트와 음성 상호작용을 통합했다.
이제 별도의 모드 전환 없이, 채팅 화면 안에서 바로 ChatGPT Voice를 사용할 수 있습니다. 말로 대화하고, 답변이 실시간으로 텍스트로 표시되는 것을 보고, 이전 메시지를 검토하고, 이미지나 지도 같은 시각 자료도 함께 볼 수 있습니다.
나는 애플이 예상보다 더 오래 시간을 들이고 있는 이유 중 하나가 바로 이런 유형의 통합을 제공하기 위해서라고 추측한다. 애플은 사실상 이 과정을 정반대로 진행하고 있다. 시리는 처음에 음성 전용 서비스로 시작했고, 이후 Apple Intelligence를 통해 이메일 요약과 같은 텍스트 기반 기능이 추가된 셈이다.
OpenAI 역시 이런 통합을 구현하는 과정에서 겪는 어려움을 어느 정도 보여 주는 것 같다. 초기 테스트에서 어떤 때는 통합이 매우 잘 작동하지만, 그렇지 않은 때도 있다. 예를 들어, 지도 화면을 보여줬다고 주장하지만 실제로는 전혀 표시되지 않은 상황을 겪기도 했다.
애플이 시리에 대해 약속한 모든 것을 실제로 구현하려면, 시리도 정확히 이런 통합을—and 그 이상을—해야 한다.
우리는 음성으로 명령을 내리고, 시리가 음성으로 답변을 제공하는 것은 물론 텍스트와 이미지를 함께 조작할 수 있기를 기대하게 될 것이다.
Discover more
computer
Apple
ChatGPT
iOS
iPhone
Siri
macOS
iPad
iPhone 보호필름
Apple Card
더 나아가, 시리는 설치된 앱들과 상호작용할 때 지능형 에이전트로 동작해야 한다. 예를 들어 “내일 아침 히스로에서 라스베이거스로 가는 첫 비행기를 예약해 줘”라고 말하면, 우리가 설치해 둔 여행 관련 앱들을 활용해 이 작업을 실제로 수행해야 한다.
이런 기능을 제공하는 일은 결코 작은 과제가 아니다. 애플이 지금의 AI 챗봇 수준에 도달할 수 있을지, 그리고 새 시리가 출시될 시점에 챗봇들이 도달해 있을 수준까지 따라잡을 수 있을지에 대해서는 여전히 상당히 회의적이다. 개인적으로는 애플이 결국 다른 회사에 AI 역량을 재하청 줄 가능성이 상당히 높다고 본다.
내 입장에서는, 그 기술이 애플이 자체 개발한 것이든, OpenAI·구글 등 다른 회사가 제공한 AI 기술을 위에서 감싸는 형태이든 상관없다. 내가 진짜로 신경 쓰는 것은 두 가지뿐이다.
첫째, 지금의 ChatGPT 폴백 방식과 정확히 같은 수준으로, 애플이 서드파티 챗봇과의 인터페이스를 커스텀해 우리의 프라이버시를 보호해 주는지 여부다. 현재처럼, 시리가 답을 찾지 못해 ChatGPT로 폴백하는 경우에도, 우리의 상호작용이 OpenAI의 학습 데이터로 사용되지 않도록 하는 보호 장치가 애플과의 합의에 포함되어 있어야 한다.
둘째, 애플이 이 지능을 기기들에 얼마나 빠르게 제공할 수 있는지이다. 내년은 우리가 기다릴 수 있는 최대 한계선이다. 그 마감 시한을 맞추기 위해 새 시리의 내부 엔진이 맞춤형 ChatGPT든, Gemini든, 전혀 다른 무언가든 상관없다. 내게는 그게 전혀 문제 되지 않는다.
Discover more
Siri
macOS
iOS
ChatGPT
Apple
computer
iPhone
Tech 뉴스 구독
iOS 앱 개발
Apple Silicon Mac
여러분은 이 문제에 대해 어떻게 생각하는가? 댓글로 의견을 나눠 주기 바란다.
FTC: 본 문서에는 수익이 발생할 수 있는 자동 제휴 링크가 포함되어 있습니다. 자세히 알아보기.