챗GPT 음성 기능
지난 9월 출시된 챗GPT 음성 기능은 지금까지 ‘챗GPT 플러스’와 ‘챗GPT 엔터프라이즈’ 사용자에게만 제공됐었습니다.
챗GPT 음성 기능은 채팅이 아닌 음성으로 질문하면 챗GPT가 이를 텍스트로 변환하고, 질문에 대한 답변을 다시 음성으로 변환해 말하는 구조입니다.
이 과정에서 음성 인식 인공지능인 ‘위스퍼(Whisper)’를 이용해 음성을 텍스트로 변환하고, 새로운 텍스트-음성 변환 모델을 사용해 생성된 문자 답변을 사람의 음성으로 변환합니다.
또 챗GPT 음성 기능은 5가지의 목소리(‘주피터’, ‘브리즈’, ‘엠버’, ‘스카이’, ‘코브’)를 제공하며, 사용자는 이 중 마음에 드는 목소리를 골라 설정할 수 있습니다.
챗GPT의 음성 기능은 기존의 애플의 시리나 아마존의 ‘알렉사’와 같은 음성 시스템과 비슷해 보이나, 챗 GPT는 대형언어모델(LLM)을 기반으로 콘텐츠를 실시간 생성할 수 있다는 점에서 이들과 근본적으로 다릅니다.
애플과 아마존 역시 최근 시리와 알렉사에 생성 AI를 추가하겠다고 밝힌 바 있기에, 더욱 그러합니다.
오픈AI에 따르면 사용자는 설정을 통해 안드로이드와 iOS의 챗GPT 모바일 앱에서 음성 기능을 활성화할 수 있습니다. 이는 아이폰에서 시리 대신 ‘챗GPT’를 기본 음성 비서로 사용할 수 있다는 의미입니다. 이는 오픈AI가 기존의 스마트폰 시스템의 환경에 침투해왔다고 볼 수 있는데요.
특히 최신형 아이폰15 프로와 프로 맥스에서는 홈 버튼을 챗GPT로 아예 교체할 수도 있기에, 애플과 구글 등 스마트폰 소프트웨어 제작사들은 생성형 AI 개발에 더욱 박차를 가할 것으로 보입니다.
챗GPT 음성 기능이 무료로 바뀐 이유는?
샘오트먼 오픈AI 대표의 복귀로 인해 챗GPT의 유료 서비스였던 음성 기능이 무료로 공개됐어요.
이 기능은 영어뿐만 아니라 한국어도 대화가 가능하죠.
따라서 한국어를 사용하는 유저들도 쉽게 이용할 수 있으며, 서울 광화문 관광지를 알려주는 기능 등을 갖추고 있어, 자율주행자동차 시대 도래로 기대감도 상승했습니다.
오픈AI 대표 복귀로 무료 공개 조치란?
인공지능회사 ‘오픈AI’에서 이전 대표가 복귀하며 무료 공개를 결정하였어요.
기존 대표는 수익에 집중하여 인공지능의 위험성에 대한 우려에 역행하는 방향으로 경영하던 반면, 복귀한 대표는 인공지능의 발전이 인류를 위협할 수 있는 위험성이 있다고 해요.
이번 무료 공개가 교육, 기업 인사, 금융, 제조업 등에서 획기적인 변화가 될 것으로 예상돼요.
선두주자의 무료 공개로 인공지능 개발이 가속화 될 것으로 예상되며, 이에 대한 기대와 우려가 나뉘고 있어요.