Krisp推口音转换功能,能否解决交流障碍?

音频初创公司Krisp推出的一项利用人工智能在通话过程中实时改变用户口音的新功能,包括该功能的特点、起源、测试情况、效果以及公司的后续计划等内容。

周三,音频领域的初创公司Krisp对外宣布,他们即将推出一项极具创新性的新功能。此功能借助人工智能技术,能够在通话进行的实时状态下,改变用户的口音。最初,该功能聚焦于将印度英语口音转换为美国英语口音。

Krisp推口音转换功能,能否解决交流障碍?

据Krisp公司透露,在进行口音转换的过程中,会完整保留说话者原本的声音特质,仅仅对音素进行切换,从而使其匹配美国口音。值得一提的是,这个功能已经在企业环境中经过了一系列的测试,目前测试版已经在Krisp桌面应用程序中正式推出。用户无论是在通话期间,还是在通话开始之前,都能够根据自己的需求随时启用该功能。

公司联合创始人阿托·米纳斯扬 (Arto Minasyan) 分享了这个功能诞生的缘由。他表示,自己在日常交谈中遇到了一个困扰,尽管他的英语水平相当不错,但很多人却难以听懂他的口音。基于这样的经历,他们萌生了改变口音或许能帮助人们更好地理解彼此的想法。于是,早在两年前,他们就开始着手解决这个问题,而如今,终于迎来了测试版的发布。

不过,记者在对该功能进行测试时发现,经过处理后的语音听起来不够自然,有时甚至还会出现漏掉单词的情况。针对这些缺陷,Krisp公司解释称,这是因为目前该功能还处于测试版阶段,随着时间的推移,模型会不断改进和优化。

Krisp公司宣称,在与企业合作对该功能进行测试时,取得了颇为可观的成果,销售转化率提升了26.1%,客单价也增长了14.8%。

对于为何首先选择研究印度口音,Krisp公司给出了解释。由于印度人在STEM领域占据了全球劳动力的很大一部分,所以他们做出了这样的决定。同时,公司还透露,他们有计划增加对更多口音的支持,其中就包括菲律宾口音。

事实上,在这个领域并非只有Krisp一家公司在探索。其他初创公司,比如获得GV支持的Sanas,已经在呼叫中心大规模地部署了类似的技术。

据了解,Krisp公司利用涵盖不同口音和方言的数千个语音样本对模型进行了训练,并且在征得用户同意的情况下,使用了会议助理的数据。该功能还有一个显著的优点,那就是它无需对用户的声音进行任何预先训练,能够实时为说话者创建个人资料。

回顾Krisp公司的融资历程,其上一次融资发生在2021年。展望未来,公司计划在今年发布iOS和Android应用程序,以此来支持面对面会议。此外,他们还在积极开发一款新的Chrome扩展程序,旨在更好地与Google Meet进行集成。

本文围绕音频初创公司Krisp推出的实时改变用户口音新功能展开,介绍了功能的基本情况、起源、测试反馈、应用效果以及公司后续规划等。虽然当前功能存在一定缺陷,但从测试成果和公司发展规划来看,该功能具有较大的发展潜力。

原创文章,作者:marjorie,如若转载,请注明出处:https://www.lingtongdata.com/5810.html

(0)
marjoriemarjorie
上一篇 2025年3月27日
下一篇 2025年3月27日

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注