日均语音请求量突破10亿次,百度输入法的又一个起点

      最后更新:2020-03-13 13:28:07 手机定位技术交流文章

      |魏启阳

      源|智能相对论

      2年的春节假期020因为新的皇冠流行病而出乎所有人的意料。大量“云”服务被激活,输入法作为在线交流工具首当其冲。它成为特殊时期测试的骨干力量之一,尤其是语音输入能力,并成为用户评估输入法是否易用的一个重要维度。

      近日,百度输入法宣布,自1月25日春节假期以来,百度输入法平均每日语音请求量已突破10亿大关,创行业新纪录。

      对许多人来说只是一个数字,但许多年后,当我们回头看时,每天平均10亿个语音请求将成为推动输入法形式和操作模式转变的标志。

      1,000,000,000次,一定是高流量和高标准的双重满足。

      返回百度输入法,日平均语音请求超过100亿次。我们需要回答两个问题。为什么它会产生如此高的数据流量?完成这样的任务你需要什么素质?第一个问题回答得很好。如上所述,各种“云”服务在特殊时期被激活,对在线交流的需求呈指数级增长,从而增加了输入方法的频率。此时,输入法比传统键盘更快,不需要用手。此外,语音输入显示出很大的优势,它不需要学习拼音和五笔规则。输入法语音请求的数量刷新了历史记录,这并不奇怪。

      就在创建新的语音请求记录之前,输入法需要解决自己的流量问题。毕竟,每天10亿次的请求流量不是一个小数目。幸运的是,经历过“春晚红包”考验的百度已经见识了“世界”,甚至有很大的空间承受更多的流量压力。

      的第二个问题的关键在于,输入法不仅需要易用,而且需要用户喜欢使用它。

      首先,在技术层面上,准确性是不可逾越的基本门槛

      作为一种输入法,允许用户愿意使用它。第一个要求是准确性,即准确理解用户的意图并表达出来

      键盘打字输入可以成为主流的输入方式,很大程度上是因为用户的一个字一个字都被完整地刻出来了,而且输入结果准确高效。与

      相反,语音输入需要经过机器“识别”到“翻译”再到演示的过程。输入链被拉伸。如果技术不够完善,不仅无法完成实时语音交互任务,而且只要任何环节出现问题,都会影响最终的输入结果,准确性难以保证。去年

      百度发布的流截断多级注意模型(SMLTA)在中文在线语音识别方面取得了两项突破:局部注意模型的识别准确率在世界上首次超过全局注意模型;全球首个大规模部署在线语音互动关注模型

      也是依靠这一技术,百度解决了传统注意力模型识别时间延迟的问题,从而无法进行大规模的在线语音实时交互,提高了百度输入法的在线语音识别准确率15%,超过行业最高水平15%同时,在离线语音识别方面,即使用户身处地铁、电梯、隧道或拥挤人群等离线场景,百度输入法仍然可以提供准确率超过98%的语音输入服务

      其次,在用户层面,“了解你”比“给你”更重要

      的准确率是满足用户需求的基本阈值,但它只解决了“使用”的问题。为了让用户喜欢使用并形成使用习惯,需要输入法来“理解”用户。你如何理解

      ?口语

      怎么样?英语和汉语混合的口语习惯怎么样?如果你有方言口音呢?在这种情况下,输入法能被清楚地识别吗?很明显,这种说话习惯一旦形成,很难在短时间内纠正和改变。尤其是对一些老用户来说,这基本上是一项他们无法完成的任务。此时,输入法不仅需要被动地向用户提供他们自己的输入能力,还需要主动地“适应”用户并“理解”用户的意图。

      百度输入法的两大功能,“方言自由语音”和“中英文自由语音”都是本产品设计思想的产物。

      ,前者是通过技术优化整合普通话和六种方言的语音识别模型,实现了方言和方言、方言和普通话的混合语音输入,也使百度输入法成为第一个实现方言免切换语音输入的输入法产品。

      后者可以实现高精度的中英文混合语音识别输入,而完全不影响中文语音输入的准确性。

      在去年的百度人工智能开发者大会上,百度输入法面临一个艰难的“说唱”识别挑战:“你的新模型比基线好多少?探索技术的深度和广度是我们的责任。我非常喜欢屏障这个词。人工智能的价值实际上是突破障碍。”

      是一个中英文混合的文本,即使读出来也要花很长时间才能理解它的意思。然而,百度输入法在现场被识别为零错误。它不仅能准确理解,还能根据语义正确断句,并以非常快的速度在屏幕上显示结果。

      最后,在创新层面,它总是给用户带来惊喜

      流截断多层注意模型(SMLTA)和“方言自由语音”和“中英文自由语音”这两大功能都是百度输入法的创新成果。显然,创新给用户带来了惊喜和体验提升,从而完成了用户的更新和保留。

      偶然使用了百度输入法的用户,在经历了功能创新后,由道变粉;百度输入法的老用户经历了输入法的不断迭代进化,一直期待着下一个创新功能,从而成为铁粉。

      目前,我们看到的百度输入法看似简单的语音到文本的转换,但实际上,百度输入法已经成为一个集硬件和软件、语音和语言、识别和交互于一体的复杂应用总而言之,

      已经取得了10亿的成就。除了有深厚的技术力量作为支撑和保证,它还需要技术温度来带来“人情”和“冷暖”

      2。打开人工智能的魔盒。我们需要什么输入法?

      我们注意到,随着人工智能开始进入工业化大生产阶段,输入法的形式和模式开始发生变化。从键盘输入到语音输入,我们只看到了其中一个现象。在人工智能的推动下,输入法在更多的维度上从内到外发生着变化。

      在讨论输入法的形态变化之前,我们需要了解输入法演变的原因。

      首先,用户需要和场景颠倒,键盘输入已经出来

      在互联网时代,输入法只出现在个人电脑端,使用场景单一。输入法制造商只需确保输入结果的准确性和快速性,就能拥有强大的竞争力。

      已经进入移动互联网时代。用户使用更多智能终端,使用更多场景。这就要求输入法不仅要适应不同终端的使用习惯,还要适应不同场景的使用要求。因此,操作模式不再局限于键盘打字输入,而语音输入模式已经成为一种非常重要的有待完善的能力。

      像这种流行病一样,除了场景反转,语音输入模式有望更快、更方便用户升级输入体验,这也推动了传统输入法的变革。

      可以预测,当我们进入物联网时代,将会有更多的输入模式。

      其次,带有人工智能内核的输入法变得无处不在,无所不能

      输入法本身一直在寻求进化迭代,但我们所说的输入技术并不局限于提高输入法准确度的基本能力,而是通过启用人工智能技术,创新输入法产品形式,使用户能够获得更好的使用体验基于自然语言处理、图像识别、增强现实等技术,百度输入法等

      引入了自然语言处理语句预测、人工智能桶图、神圣语句匹配图、皮肤主题C位识别等功能,成为业界第一款智能实现多场景语句预测的输入法产品。去年发布的人工智能发现版还创新性地引入了新形式的全语音交互产品和领先的人工智能功能,如空中手写。任何输入法产品都能掌握

      用户需求和使用场景的变化,但能否应对这些变化将极大地考验产品超越“输入”的能力一个是对行业发展趋势的洞察,另一个是支持产品迭代的技术储备。

      3,踏上10亿步,百度开启输入法生态空间

      1亿语音请求互动每天是一个里程,也是一个台阶,一个迈向输入法下一个形态高度的台阶对于百度的输入法来说,这些创纪录的数据为其开放生态空间的播放方式提供了依据。

      是第一个用户群

      在此之前,根据最近发布的《2019年中国第三方手机输入法市场年度专题研究报告》,百度输入法去年的月增长率为行业最高,市场份额为43.1%,几乎相当于搜狗

      互动语音请求流量的爆发今年春节期间,百度输入法不仅完成了对用户语音输入的普及教育,而且由于新输入法带来的体验升级,进一步增强了用户的粘性。

      秒是内容基础

      当用户基数足够大时,为了满足用户的个性化需求,输入法的内容承载形式也进行了创新。

      百度输入法不仅与樱桃、FILCO、ROG等近20个周边品牌建立了独家内容生态联盟。与这些周边品牌联合推出旗舰仿真键盘精品授权皮肤,还与樱桃合作打造仿真键盘,高度恢复了樱桃物理机械键盘轴在华为Mate30 pro上的触感。

      可以是咸的和甜的。输入内容的丰富不仅是用户体验的升级,也是产品技术的升级。

      第三是硬件制造商的合作基础

      百度输入法的庞大用户群自然会为硬件制造商打开预装渠道,成为更多硬件终端的预装应用。

      事实上,百度输入法长期以来一直是华为预装的合作输入法。两者在模型适应和输入经验构建上形成了默契。显然,双方的合作已经形成了双赢的结果,这也为其他硬件制造商树立了一个可供参考的模式。

      可以想象,当百度输入法进入越来越多的硬件终端时,结合其庞大的用户群和丰富的内容,将会建立一个动态的输入法生态。

      由ecology针对单一输入法应用。你可以把它理解为“匆忙奔跑”或“缩小维度”的竞争。百度在输入法的战略布局上也处于领先地位。

      此内容是[智能相对论的原创内容]。

      仅代表个人意见。未经授权,任何人不得以任何方式使用它,包括重印、摘录、复制或创建镜像。约

      张图片来自互联网,版权归属尚未核实。它们不用于商业用途。如果有任何侵权,请联系我们

      智能相对论:

      人工智能新媒体;

      今日青云计划十大赢家;

      澎湃新闻科技排行榜月度前5名;

      篇文章长期“占据”钛媒体前10名。

      是《人工智能100,000为什么》的作者

      [重点关注领域]智能驾驶、人工智能+医疗保健、机器人、人工智能+硬件(包括无人机、智能手机、电视)、物联网、人工智能+金融、人工智能+教育、人工智能/虚拟现实、云计算、开发人员和芯片背后、算法等

      本文由 在线网速测试 整理编辑,转载请注明出处,原文链接:https://www.wangsu123.cn/news/1139.html

          热门文章

          文章分类