인공지능 스타트업 스켈터랩스는 자사의 AI 기반 대화엔진의 인텐트 분류에 대한 자체 성능 테스트 결과를 공개하며, 대화형 인공지능 시장에서의 영역 확장 계획을 밝혔다.
스켈터랩스는 지난 6월 한국정보화진흥원이 인공지능 학습용으로 공개한 250만건 데이터 중 소상공인 및 공공민원 분야에 대한 총 10만 건의 한국어 대화 데이터를 활용하여 테스트를 진행했다. 그 결과, 스켈터랩스는 72%, 글로벌 A사와 B사는 모두 65%의 F1 스코어(F1 Score)를 기록했다. F1 스코어는 정밀도(precision)[1]와 재현율(recall)[2]을 모두 고려한 종합값으로 인공지능 기술의 분류 평가 수치 중 하나이며, F1 스코어가 높다는 뜻은 그만큼 질문의 의도를 정확히 파악한다는 의미이다.
조성진 스켈터랩스 CTO는 “이번 테스트로 글로벌 탑 기업 대비 탁월한 인텐트 분류 정확도를 확인했고, 특히 600개 인텐트로 70%가 넘는 수치를 기록한 것은 스켈터랩스 대화엔진의 높은 실용적 가치를 의미하는 고무적인 결과다. 이는 인공지능 기술 고도화에 집중해온 노력의 산물이라고 생각하며, 앞으로도 한국어 외의 다양한 언어에 적용했을 때도 유사한 수준의 정확도를 실현할 수 있도록 기술 수준을 높여갈 계획이다"라고 말했다.
스켈터랩스는 국내 대기업 및 스타트업들과의 파트너십으로 대화형 에이전트 구축 프로젝트를 진행하고 있으며, 향후 대화엔진 제품에 대한 브랜딩 구축 및 세일즈 강화로 한국은 물론 해외 시장을 적극적으로 공략할 예정이다.