자연어 처리 기술의 발달로 AI 스피커에서 수행할 수 있는 기능이 확대 되었음에도 불구하고 음성인 식 기술은 아직 미흡한 부분이 있으며 사용자들은 자연스러운 대화가 안 되는 등 일상 사용 환경에서의 불편을 경험한다. 이러한 자연스러운 대화의 음성인식이 어려운 주요 이유 중 하나는 “음…”, “어…” 등의 간투사와 같은 비정형 발성에 기인한다. 이러한 배경을 토대로 본 연구는 AI 스피커 사용 환경에서 간 투사 사용 시 AI 스피커의 반응 대기 시간 조절(1초, 2초, 3초, 4초, 5초, 6초, 7초)과 대기 방법(피드
백 없음, 빛 피드백, 빛과 음성 피드백)이 사용자 경험에 어떠한 차이를 보이는지, 또 사용자가 가장 적 정하다고 생각하는 길이가 무엇인지 알아보고자 하였다. 실험은 음성 프로토타입을 제작하여 오즈의 마 법사(Wizard of Oz)방식으로 총 50명을 대상으로 진행되었으며, 참가자는 반응 대기 시간 조절에 따른 세 가지 조절변인을 모두 경험한 후 각각에 대하여 사용성 평가와 인터뷰를 진행하였다. 실험 결과, 반 응 대기 시간 조절은 모든 사용자 경험 요인(선호도, 유용성, 사용성, 신뢰도, 오류 타당성)에서 개선 효 과가 있었다. 그리고 빛, 빛과 음성 피드백의 제공은 신뢰도의 면에서 유의미한 차이를 보여주었다. 이 를 통해, 적절한 반응 대기 시간 조절과 빛, 빛과 음성 피드백의 제공이 AI 스피커 사용 환경에서 간투
사 사용 시 긍정적인 영향을 미친다는 것을 확인하였다. 본 연구는 향후 AI 스피커 설계 시 사용자의 간투사 사용이 발생시키는 오류에 대한 전략을 수립하는 데 있어서 시사하는 바가 있으며 AI 스피커에 있어 기초적이고 핵심적인 고객 만족도 향상에도 기여할 수 있기를 기대한다.