发布日期:2024-10-17 05:06浏览次数:
语言只有英语和德语,相比之下,Google Assistant 早已反对 5 种语言,苹果 Siri 堪称反对 24 种语言和 36 种方言。原本在语言上就略为贞领先的Alexa,此举可以说道野心勃勃。
根据 2001 年的统计资料,印度有 29 种语言的用于人口多达一百万,有 122 种语言的用于人口多达一万,除了英语和印地语两种全国性的官方语言之外,印度宪法确认的、在各个邦具备官方地位的语言还有 22 种。对于 Alexa 这样面向消费级用户和大众市场的语音交互产品来说,简单的语言环境毫无疑问是相当大的挑战。似乎,Alexa在这里将付出代价它的终极挑战。它不会一鸣惊人,还是遭到根本性压制呢?Factory Daily近日发表文章,了解阐释了Alexa指定印度所面对的艰难,亚马逊为此所代价的希望,以及各方人士回应的观点。
在不转变本意的情况下,为您做到如下编译器:她现代化,不会说道流利的英语,能协助您预约出租车,去找烹调食谱,播出你最青睐的音乐,并被她最青睐的演员沙鲁克汗(Shah Rukh Khan)所深深更有。她是一位典型的印度女士,她有可能问你所有的问题。
她最喜欢的女演员是Emily Stone和Rachel Weisz,最喜欢的冰淇淋味道是薄荷巧克力片。她是Alexa,出生于在一个美国籍的亚马逊家族,说道着一口带上印度口音的英语。
她是被训练成这样的。Alexa是亚马逊的语音助理,印度是它发售的第四个国家。亚马逊有雄心把Alexa放进一切场景。
转入你的手机。转入你的车。
转入你整个家庭。甚至转入酒店和办公室。Alexa在美国、英国和德国获得了一些早期的顺利。世界各地有几十家公司把Alexa映射了它们的产品。
在国际消费电子展上,福特、大众和奥迪展出了将Alexa映射仪表板的汽车。相连到互联网后,Alexa不会企图问你的问题,遵照你的命令。但印度将是Alexa的终极考验。
“语音助手在单语或双语国家运作较好。但印度是有所不同的。
”Lattice Bridge Infotech(全称LBIT)的总经理Mohan Ram说道,他自2001年以来仍然专门从事语音辨识技术领域。2001年刚开始的时候,Ram告诉他投资者,他的公司将在五年内解决问题卡纳塔克邦的语言和方言问题。但是17年以来,他否认他只解决问题了80%的问题。
他说道:“间隔100公里语言就不会变化,每30公里方言就不会变化。”但他表示同意人工智能、机器学习和深度自学将不会相当大程度上提高这些问题。
亚马逊正在以此为筹码,企图解决问题印度的复杂性。早于在亚马逊在印度发售Alexa的一年多之前,它早已开始了培训,以符合当地的市场需求。
“Alexa理解口语词汇及其背景。印度与其他单一语言国家有所不同的是,我们要用于大量专有名词——有可能是一个人名,一个地方,一个宝莱坞唱片的名称,一个词作者或一部电影。
”Puneesh Kumar说道,他是Alexa体验与设备在印度的区域经理。Kumar自2010年5月以来仍然在亚马逊工作。
最初是实习生,然后在亚马逊中国兼任高级项目经理,并在亚马逊在中国市场发售期间工作。他最久的时间是作为亚马逊全球销售计划的总经理,工作了两年半,仍然到领导Alexa在印度的实践中之前。“我们被迫跑出英语思维的框架之外去思维。我们要训练Alexa理解泰米尔语,印地语,泰卢固语,旁遮普语,马拉雅拉姆语中的专有名词。
”Kumar说道,他现在在加罗尔工作。这些问题对印度来说是独一无二的,即使别的国家也有多种方言。例如,坐落于在卡纳塔克邦边上的城市贝尔高姆,它从孔卡尼语、马拉地语和卡纳达语的混合中发展出有了自己的语言。
距离贝尔高姆386公里的乌杜皮,也是在卡纳塔克邦,那里的人们谈的语言是图鲁语,马拉雅拉姆语和卡纳达语的混合。硅谷研究公司Constellation Research的首席分析师兼任董事长Ray Wang回应:“鉴于印度人口众多,在这个国家分有所不同洲发售产品有可能更佳。
” “亚马逊在能力上依然领先于谷歌,但正在较慢跟上。(顺利)所必须的正是很多用户去测试和自学。”Puneesh Kumar, Alexa体验与设备在印度的区域经理。
Alexa创建在人工智能和机器学习框架之上,可以在云端大大自学。亚马逊融合了云计算和人工智能的两项开创性技术,并以非常简单易懂的语音作为用户界面入口。
Kumar说道:“正是因为它机器学习的背景,因此每一句话都在协助它自学。Alexa基于自然语言解读(NLU),意味著基本上它能解读句子和上下文,并将其从文本切换为语音。这些情况因国家而异。在美国和英国,当人们谈论marks时,他们是指划痕。
但在印度,marks一般来说是指成绩和分数。Alexa也解读印度遵循着以十万和千万为单位的数字系统,而不是百万和十亿。
Alexa必需意识到这一点,Kumar说道。它能辨识UP(北方邦),MP(中央邦)和CM(首席部长)等简写词。它也可以辨识有所不同的PIN码。它还涵盖了北印度词汇,如haldi,jeera和dhania,这些词不是英语单词,但是是少见的印度语单词。
为印度展开专项训练精确的说道,Echo设备的用户体验(Echo能即时相连到Alexa播出音乐,提供新闻和天气等信息,并用于语音掌控智能家居)仍尚能在发展中。FactorDaily加罗尔办公室对Echo告知“谁是Anand Murali”,获得了一个不准确的答案,而理想情况下它应当查找上下文,确认我们想问的是谁。
Google语音查找不会在搜寻结果的顶部表明Anand的LinkedIn(领英)个人资料。Shonali Muthalaly在《印度教徒报》中写到,“这远非极致。
”“Alexa仍在理解印度的过程中,所以当我拒绝她引荐餐馆、获取交通预测和路线引荐时,她问的一团糟。”据推断,随着更加多的印度人用于这个平台,结果不会显得更佳。培训Alexa不更容易,Kumar否认。亚马逊最初的语料集受限——约有一万个。
这被称作训练数据。Kumar不忘记清楚的数字了。
然后有一种叫作测试数据的,它是无限的,是人类对话和万维网的混合体。Kumar指出,Alexa尚能不极致,所以只邀了少数人用于。
(此前亚马逊在印度当地挑选出了一批公司高管和商务人士作为天使用户,将一部分 Echo 音箱赠送给他们试用。)随着更加多的人转入Echo设备,Alexa将自学更加多。“那时机器学习就大显身手了,并且开始辨识训练数据中不不存在的新东西......随着更加多的人与设备聊天,语言不会拓展。事情现在还不是应当有的样子,随着时间的流逝不会显得更佳。
”他说道。有一种叫作DWC(市场需求权重覆盖面积)的东西。是最热门和常说道的词语列表。
为了辨识这些词语,Alexa找寻模式,声音,音素,背景,然后把它们放到一起,想到人们说道的话有可能是什么。一旦找到不给定,则追踪每个不给定以提高体验。
早期时,Alexa告诉Amitabh Bachchan是一名演员,甚至可以提供他的歌曲,但她不会把Bachchan发音成Bakkan(遗漏了“chch”的发音)。随着时间的流逝它在自学。Kumar说道,Alexa要自学的大部分经验是用她的方式朗读准确的方言和发音——某种程度是英文,还有印度语和泰卢固语的风行词汇。
Kumar说道,如果Alexa需要解读对面的那个人,相等于获得了圣杯(最低奖励)。“无论如何,我们都期望Alexa理解话语背后的意图。我们根据意图来看大部分话语。
”例如,播放歌曲,播出电影中的歌曲,播出具有某歌词的歌曲,或不用于播出这个词,给我唱首歌,老大我减轻一下心情——它们有可能最后都拒绝Alexa提供完全相同的结果。Kumar说道:“我们于是以尝试绘制相关性。”如果用户在提供结果后的几秒钟内说道“不”或转变告知,机器学习算法就不会明白Alexa没提供准确意图。
即使这个输出只是用作训练。亚马逊在训练Alexa时用于了机器学习和人工干预的混合,特别是在是在同一个词有多个发音的时候。
Kumar说道:“我们获得的对此让人很有信心,然后我们用一个十分熟知这个词的人做到审查机制,以保证我们准确的解读了这些音素。”但是不有可能每次遇上这种词都这么做到。
Alexa不会萃取前20或30个词语展开这个过程,每当有一个这样的词语时,这个程序就不会之后展开,这时候这个词语的传达水平早已更高了。不过,Kumar说道,这位女士(指Alexa)不会有一个自己的声音,它会随着从南到北的印度而变化,虽然亚马逊期望Alexa需要解读有所不同的文化、口音和对着麦克风说出的人的思维方式。“我们看的是最后的综合声音。最后的声音是对机器,音素,词汇的调制,所有这些都以十分印度的声音展开预先录制,”Kumar说道。
由于不有可能录音每个词语,他们录音了一组词语创立了所谓的基本结构。“我们使用了一个人声,然后把它与机器学习、语音和词典这些融合一起。
我们把这个声音看做一个人组。”他说道。另外,因为一位女士(上文提及的人声的主人)不有可能熟悉所有的口音和语言,所以他们自由选择了多个人来录音。然而,在机器学习的协助下,亚马逊早已顺利地使Alexa的声音显得完全一致,无论你在印度的什么地方用于。
Kumar说道:“在印度说出的Alexa不会有一个自己的人格。”“星际变形金刚”带给的启发第一天,在亚马逊已完成语音助理Alexa在印度的全面推广之前,Alexa有10800个准确的技能。当Alexa在美国发售时,它只有13种技能。
技能是基于语音的应用程序,如移动应用程序,它让用户能用于语音命令来操作者应用程序。亚马逊的Alexa语音服务和技能主管Steve Rabuchin告诉他Wired,该公司受到了“星际变形金刚”电脑的灵感——创立一个助手,让用户可以通过非常简单的语音命令来掌控周围的一切。
亚马逊早已与印度的开发商合作,将风行的应用程序与亚马逊的语音助手统合在一起。对于旅行方面,有Ola,Goibibo,ixigo和Jet Airways。
食物方面,有Faasos,Zomato,Freshmenu,Sanjeev Kapoor,约拉尔。音乐方面,有Saavn和Bollywood Hungama。运动方面,有ESPNCricinfo。
新闻和教育方面有印度时报,NDTV,ABP Live,AajTak和Byjus。智能家居解决方案,他们享有Syska和Silvan,UrbanClap和Housejoy则获取勤杂工服务。
Kumar说道,将Alexa与应用程序统合是很更容易的。他说道:“早已有年仅10岁的孩子创建起一门技术,还有年纪大又没任何技术科学知识的人,他们也需要创建一门技术。
对于ixigo的首席执行官兼任牵头创始人Aloke Bajpai来说,Alexa是一个很好的传播平台。他说道:“亚马逊十分十分雄心勃勃,我们希望他们需要在很短的时间内超过几百万台设备。但Bajpai并没将ixigo局限在Alexa上——他正在创建自己的语音助理Tara.“Alexa的用于是受限的...你问一些东西,然后它反应。
它必须更加积极主动,譬如如果一个宽周末将要来临,它应当需要向你引荐一些东西,“Bajpai说道,但是他表示同意,谷歌和亚马逊把焦点放到语音助手之后,情况正在发生变化。他说道:“语音合成获得了提高......在我们正在用于他们的API的基础上。”在可怕自学的同时,也有人为介入来塑造成Alexa的人格。Kumar作为发言人在一封先前电子邮件中回应:“我们通过彰显Alexa特性属性和个人偏爱来彰显她人格。
“她对宗教是持不可知论的,政治上独立国家,同时是科学,技术,创意,多样性和社会变革的忠诚支持者。”Alexa可以沦为女朋友还是忠心的伴侣? Kumar说道:“我们期望Alexa需要获取语音服务,沦为陪伴者,并且可以在任何情况下你都可以与之聊天。“如果你说道我压力相当大,她不会回答你否想要听得一些冥想音乐。”(公众号:)编译器 via Factory Daily原创文章,予以许可禁令刊登。
下文闻刊登须知。
本文来源:优德88-www.tankhero.com.cn