晋中| 革吉| 离石| 大厂| 屏山| 长白山| 洋县| 济阳| 曲麻莱| 凤台| 靖安| 青白江| 常熟| 杜尔伯特| 汤原| 班戈| 丹凤| 长宁| 招远| 宣城| 遂宁| 泉港| 喀喇沁旗| 番禺| 晋城| 周口| 汕尾| 科尔沁左翼中旗| 武清| 江苏| 徐闻| 冷水江| 赣县| 寿阳| 抚松| 平利| 枣强| 隆昌| 绥芬河| 湖口| 祁门| 铜山| 永丰| 宾县| 垫江| 九江市| 石拐| 若羌| 平谷| 辽阳市| 桐柏| 魏县| 内乡| 类乌齐| 林周| 汾西| 郧县| 台儿庄| 若羌| 巩义| 魏县| 康马| 伊金霍洛旗| 柘城| 浪卡子| 朝天| 清原| 樟树| 吉木乃| 营山| 定日| 金沙| 泰顺| 信阳| 永川| 安达| 宝坻| 定安| 鄂州| 登封| 安图| 宜川| 太谷| 那曲| 华县| 丹寨| 兖州| 南岔| 广水| 盐山| 临洮| 富顺| 阳高| 吉水| 岢岚| 固安| 武隆| 香格里拉| 尉犁| 晋中| 青白江| 方山| 嘉黎| 蓬安| 上海| 温江| 沅陵| 延安| 伊春| 寻乌| 武汉| 雅江| 玉山| 黟县| 孙吴| 隆尧| 吉安县| 鸡泽| 朝阳市| 赵县| 沁水| 山阴| 靖西| 昭觉| 乐东| 献县| 基隆| 绥芬河| 克拉玛依| 从化| 宁夏| 长子| 金湖| 罗江| 秀屿| 柞水| 邹平| 昌图| 错那| 城步| 丰都| 辰溪| 宝清| 于田| 兴县| 石拐| 洛川| 海晏| 河间| 永新| 三明| 剑川| 肇东| 马尔康| 梁山| 叶城| 嘉祥| 辛集| 额尔古纳| 雅安| 弓长岭| 绥芬河| 黄骅| 泰州| 新野| 赵县| 大宁| 丰镇| 孟村| 南昌县| 卫辉| 塔河| 汕头| 马龙| 平原| 宁武| 江油| 长汀| 峡江| 密山| 金乡| 保德| 瓦房店| 宁强| 成安| 沁水| 广水| 肃北| 澄迈| 聊城| 屯昌| 翠峦| 鸡西| 普安| 武川| 英德| 钓鱼岛| 林周| 南阳| 蒲江| 石台| 万荣| 襄阳| 屯留| 瑞安| 蓬莱| 靖宇| 贵德| 资源| 大方| 札达| 萨迦| 淮南| 永昌| 鹿邑| 大余| 青县| 额敏| 仁布| 德庆| 卢龙| 望谟| 长汀| 乐东| 汝城| 西畴| 安阳| 东乡| 广平| 怀柔| 临江| 老河口| 石河子| 英吉沙| 彰化| 竹山| 新洲| 仁布| 民丰| 会宁| 巴林左旗| 澄迈| 湾里| 陵川| 浮梁| 太原| 广元| 太原| 广元| 万荣| 东丽| 龙岩| 隰县| 东西湖| 吐鲁番| 东阿| 康平| 宁陕| 绥化| 若尔盖| 舞钢| 舞钢| 武都| 三门峡|

红 配 绿 . 芳 菲 季 节 搅 动 你 的 春 心

2019-09-16 22:11 来源:新浪网

  红 配 绿 . 芳 菲 季 节 搅 动 你 的 春 心

  (三)个人资料提供:1、在注册时,用户应该提供真实、准确、最新和完整的个人资料;2、如个人资料有任何变动,用户必须及时更新相关信息。中国如果不走创新驱动发展道路,新旧动能不能顺利转换,就不能真正强大起来。

修改后的服务条款一旦公布即有效代替原来的服务条款。在任何情况下,思客认为用户的行为可能违反国家法律、法规,可以在任何时候不经事先通知终止向该用户提供服务。

  四是整合性。  为了经受住执政考验,我们党一直保持着强烈的忧患意识。

  这不仅成为中国文化产业增值最快的版块,也对网络原作产生了“放大器效应”。  习近平总书记指出,中国特色社会主义制度是当代中国发展进步的根本制度保障。

网络综艺类型的不断丰富实际上映射出网络用户需求的进一步释放。

  去年的“爆款电影”,是《捉妖记》、《煎饼侠》、《大圣归来》这三部,基本上都是合家欢电影。

    根据中国科学技术发展战略研究院发布的《国家创新指数报告2016-2017》,我国创新指数得分分,排名升至17名,比排名第一的美国差分,属于世界第二创新集团。在强调技术进步的时候,没有注意到技术进步与自然资源的关系,导致了农村环境问题的出现。

  以“忙不过来”这样的理由对服务退步轻描淡写,对群众利益的轻慢不要再有了。

  不得侵害他人合法权益;如用户在思客发布信息时,不能履行和遵守协议中的规定,本网站有权修改、删除用户发布的任何信息,并有权对违反协议的用户做出封禁ID,或暂时、永久禁止在本网站发布信息的处理,同时保留依法追究当事人法律责任的权利,思客的系统记录将作为用户违反法律的证据。  理想信念教育是党的思想建设的重中之重。

  这是近代中国“鱼烂而亡”的典型例子。

  有人把它与好莱坞大片、日本动漫、韩剧并称为世界“四大文化现象”。

  作为文创市场泛娱乐产业的内容资源,网络文学带动了千亿级大众娱乐市场的孵化发展,这些都是值得关注的业绩和亮点。(三)个人资料提供:1、在注册时,用户应该提供真实、准确、最新和完整的个人资料;2、如个人资料有任何变动,用户必须及时更新相关信息。

  

  红 配 绿 . 芳 菲 季 节 搅 动 你 的 春 心

 
责编:

中共中央宣传部委托新华通讯社主办

半月谈

首 页 >> 资讯 >> 发现基层 >> 北京日报:语音识别距人类只差0. >> 阅读

北京日报:语音识别距人类只差0.4%?

2019-09-16 08:40 作者:姜姝姝 来源:北京日报 编辑:常磊
分享到:

(熊丙奇)[责任编辑:王营]

日前,美国一家公司宣称专业速记员在记录对话时,转录词错率为5.1%,而该公司最新研发的语音识别系统词错率已达到5.5%,超越之前的历史最佳水平,树立了新的里程碑。语音识别,是人工智能领域的核心问题之一,0.4%的差距似乎意味着机器即将比肩人类。

 
    已过“甲子”之年
 
    斯坦福大学的相关研究者在2016年9月发布了一篇名为《2030年的人工智能与生活》的文章,提到:人工智能领域正式诞生于1956年夏天,一场由约翰·麦卡锡组织的在美国达特茅斯暑期研究项目的研讨会,在多年以后被认定为全球人工智能研究的起点。
 
    其实,对于人工智能子项目之一的语音识别来说,它的历史甚至比60年还要久。
 
    语音识别的研究源头可追溯至1950年,计算机科学之父阿兰·图灵在《思想》(Mind)杂志上发表了题为“计算的机器和智能”的论文,首次提出了机器智能的概念,论文还提出了一种验证机器是否有智能的方法:让人和机器进行交流,如果人无法判断自己交流的对象是人还是机器,就说明这个机器有智能了,这就是后来鼎鼎有名的人工智能图灵测试。
 
    图灵测试的概念极大影响了人工智能对于功能的定义,以此为途径,卡内基梅隆大学的两位科学家希尔伯特·西蒙和曼纽尔·布卢姆做了大量的前期工作,非常精妙地证明了罗素《数学原理》52道中的38道。西蒙甚至宣称在10年之内,机器就可以达到和人类智能一样的高度。
 
    在这一时期,科学家们也将语音识别比作“机器的听觉系统”,该技术可以让机器通过识别和理解,把语音信号转变为相应的文本或命令。1952年,贝尔研究所、Davis等人研制了世界上第一个能识别10个英文数字发音的实验系统。1960年,英国的Denes等人研制了第一个计算机语音识别系统。
 
    从“模拟”人脑到开创统计方法
 
    当20世纪50年代明确了人工智能要模拟人类智慧这一大胆目标后,这一领域经历了近20年的辉煌。研究人员开展了一系列项目,表明计算机能够完成一系列原本只属于人类能力范畴之内的任务,例如证明定理、求解微积分、通过规划来响应命令、履行物理动作,甚至是模拟心理学家心理实验、作曲家谱曲这样的活动。
 
    但是,过分简单的算法以及计算能力的限制,严重阻碍了人们使用人工智能来解决更加困难和多样化的问题。
 
    这一阶段在人工智能的细分领域语音识别上,科学家们也走上了同样的弯路。他们认为,计算机要完成语音识别这类只有人才能做的事情,必须先让计算机理解自然语言,导致研究局限在人类学习语言的方式上了,即电脑模拟人脑,语言学者参与了大量的研究工作,但最后的成果却近乎为零。伴随着对未来继续努力的失望,人工智能包括语音识别都于20世纪70年代中期逐渐淡出公众视野。
 
    转机出现在统计语言学的创立上。这不得不提一个关键性人物——德里克·贾里尼克和他领导的IBM华生实验室,他们创新的使用统计方法,将当时的语音识别率从70%迅速提升到90%,同时语音识别的规模从几百个单词上升到几万个单词,使得语音识别就有了从实验室走向实际应用的可能。
 
    在贾里尼克之前,科学家们都把语音识别问题的核心归结为语言学中的规则问题,而贾里尼克将它当作通信问题后,用两个隐含马尔可夫模型(声学模型和语言模型)把语音识别重新概括清楚了。
 
    这个框架结构至今仍对语音识别影响深远,它不仅从根本上使得语音识别有使用的可能,而且奠定了今天自然语言处理的基础。贾里尼克后来也因此当选美国工程院院士,并被某杂志评为20世纪100名发明家之一。
 
    尽管贾里尼克在1972年就提出了新的研究范式,但模拟人脑与统计学的方法之争,却持续了近十五年时间,语音识别领域历经了十五年的新旧交替后,最大的成果其实是在技术的应用及产品化方面出现了进展。
 
    大进步的催化剂
 
    在互联网大爆发的20世纪90年代,人工智能的相关研究又一次停滞了。直到21世纪前10年,出现了一系列复兴人工智能研究进程的要素,尤其是下面这些重要的因素和核心技术:
 
    大数据。得益于互联网、社交媒体、移动设备和廉价的传感器,这个世界产生的数据量急剧增加。大数据是人工智能发展的助推剂,这是因为有些人工智能技术使用统计模型来进行数据的概率推算,如语音识别,通过数据的海洋中丰富的语料,使得技术不断优化。
 
    新算法。算法是解决一个设计程序或完成任务的路径方法。在一个完整的工业界语音识别系统里,最关键的是深度学习算法,还有很多工作是专业领域相关的算法,以及海量数据收集和工程系统架构的搭建。这些算法本身很重要,同时也是其他技术的推动者,比如机器学习算法Google的TensorFlow目前就被开源使用。
 
    可以说,任何技术都有蓄能阶段和爆发阶段,人工智能包括语音识别技术的爆发都得益于以上条件。这也不难理解,从语音识别来看,它是需要经验、数据和用户反馈共同作用来提升表现的。需要利用用户的反馈总结出一些特点。
 
    谷歌是最早在全球范围内大规模使用深度学习算法的公司,也最早开创了用互联网思维做语音识别。在这方面,科大讯飞受到谷歌的启发,迅速跟进成为国内第一个在商用系统里使用深度学习的公司。
 
    现有成绩和待解难题一样多
 
    语音识别技术已经发展了几十年,因为大数据和深度学习的应用,这一领域的传统强者成了谷歌、亚马逊、苹果和微软这些美国科技巨头,据统计,美国至少有26家公司在开发语音识别技术,而中国则有近50家公司研究这一领域。
 
    尽管谷歌这些巨头在语音识别技术上的技术积累和先发优势让后来者似乎难以望其项背,但因为一些政策和市场方面的原因,当然也有部分原因是中文的复杂程度高于英语,所以国际巨头的语音识别主要偏向于英语,中文领域的语音智能机会则留给了科大讯飞、百度、搜狗等中国公司。在国内,这些本土化产品更为用户所熟知。
 
    中文领域的识别难度在哪里?举个简单的例子,鲁迅《孔乙己》中的孔乙己之问:茴香豆的“茴”有几种写法?或者一个更有时代感的案例,如何形容物流很快?据说,在汉语里回答这个问题竟然至少有3600种说法,比如第二天就到了、物流很给力、给快递点赞等不尽其详。尽管语音识别在近些年来取得了巨大的进步,但其实仍然还有很多的工作要做。
 
    此外,还有确保语音识别能在更为真实生活的环境中良好地工作。这些环境包括具有很多背景噪声的地方,比如聚会场所或在高速路上驾驶的时候;还有在多人交谈环境中将不同的说话人区分开。
 
    还有一个更深层次的难题是,如果需要实现人机对话、人机写作,不只是需要用机器转录来自人类嘴巴的声音信号,更要理解人们所说的话。
 
    从语音识别来看,下一个前沿是从识别走向理解,真正的人工智能仍然还在遥远的地平线上,在机器能理解其所听到或看到的事物的真正含义之前,还需要很长时间的工作,有很长的路要走。
 
    或许也可以说,我们正在从一个人类必须理解计算机的世界,迈向一个计算机必须理解我们的世界。亚里士多德曾说过,如果机器能干很多活,岂不能让人类解放出来,或许这一解放的起点就是“理解”。(姜姝姝 作者为《机器人产业》杂志副总编辑)


版权声明:凡本网注明"来源:半月谈网"的所有作品,均为半月谈网合法拥有版权或有权使用的作品,任何报刊、网站等媒体或个人未经本网书面授权不得转载、 链接、转帖或以其他方式复制发布。违者本网将依法追究法律责任。如需授权,点击 获取授权

昌平党校 罗鸦子 田巷马林 浙江拱墅区上塘镇 东石村
金钟河东街 曲洋圩 下八庙镇 爱得 复兴路水西园