스픽, GPT-4o 기반 ‘라이브 롤플레이’ 기능 공개
입력 2024.10.02 15:04
- 실시간 음성 처리로 원어민과 대화하는 듯한 자연스러운 영어 학습 경험 구현
- AI 기반 개인화 학습과 실시간 피드백
  • AI 영어 학습 솔루션 ‘스픽’을 운영하는 스픽이지랩스코리아가 OpenAI 개발자 컨퍼런스에서 GPT-4o 기반의 '실시간 API(Realtime API)'를 활용한 ‘라이브 롤플레이’ 기능을 공개했다.

    지난 1일(현지시각) OpenAI는 미국 샌프란시스코에서 개발자 컨퍼런스 ‘OpenAI DevDay’를 개최하고 GPT-4o 기반의 ‘실시간 API'를 발표했다.

    ‘실시간 API’는 AI가 인간의 말을 인식하는 과정에서 음성을 텍스트로 변환한 후 인지·대응하던 기존 기술과는 달리, 음성과 음성 간 직접적인 상호작용을 가능하게 한다.

    이번 컨퍼런스에서 스픽은 OpenAI의 ‘실시간 API’와 자사의 독자적인 학습 엔진을 결합한 ‘라이브 롤플레이’ 기능을 선보였다.

    스픽은 ‘라이브 롤플레이’를 통해 사람과 대화하는 것처럼 빠르고 자연스럽게 반응할 수 있도록 AI 튜터를 고도화했다. 

    기존 AI 대화 시스템은 음성 인식, 텍스트 처리, AI 음성 합성 등 여러 단계의 복잡한 처리 과정으로 인해 대화에 지연이 발생하여 자연스러운 상호작용이 어려웠다.

    반면, ‘라이브 롤플레이’는 음성 간 직접 상호작용을 통해 이러한 한계를 극복해 사용자에게 실제 원어민과 대화하는 듯한 경험을 제공한다.

    더 나아가 ‘라이브 롤플레이’는 사용자의 비언어적 요소까지 분석한다. 발화자의 톤, 발음, 운율 등을 실시간으로 이해하고 즉각적인 피드백을 제공해 사용자들은 더욱 효과적이고 몰입도 높은 영어 학습을 경험할 수 있다.

    스픽은 ‘라이브 롤플레이’를 통해 개인화된 학습 경험을 한층 강화할 예정이다. 또한 사용자의 언어 능력과 학습 패턴을 분석하는 '지식 그래프 시스템'을 도입하여 실시간으로 사용자의 언어 능력을 측정할 계획이다. 

    이를 통해 각 개인의 수준에 맞는 대화 난이도와 적합한 문장 패턴, 어휘를 제시함으로써 학습 효과를 극대화할 예정이다. ‘라이브 롤플레이’는 먼저 일부 사용자들을 대상으로 베타 테스트를 진행할 예정이며, 올해 말 정식 출시를 목표로 하고 있다.

주요뉴스