当前位置:首页 > 关于讯飞 > 技术创新 > 核心技术
关于讯飞

语音是人类沟通和获取信息最自然便捷的手段和方式,也是文化的基础和民族的象征。而智能语音及语言交互技术,可以应用在社会生活的方方面面,拥有广阔的产业化前景,尤其在军事、教育、汉语国际推广等重要战略领域,都有广泛应用和重大推广意义。因此,该技术及其产业一直是国内外竞相竞争的热点和焦点。

科大讯飞在智能语音核心技术研究领域,一直秉承“从市场中来、到市场中去”,“用正确的方法、做有用的研究”等核心理念,致力于建立智能语音及语言核心技术和核心技术应用产业化两大方面的竞争力。科大讯飞的核心技术主要包括:语音识别技术、语音合成技术、自然语言理解技术、语音评测技术、声纹语种技术、手写识别技术等。科大讯飞始终坚持提供国际领先的语音及语言整体解决方案,不断推出符合国家和社会需求的智能语音及语言技术产品及应用服务。

科大讯飞的主要核心技术介绍如下: 科大讯飞的主要核心技术
语音识别技术
语音识别技术

所要解决的问题是让计算机能够“听懂”人类的语音,将语音中包含的文字信息“提取”出来。该技术在“能听会说”的智能计算机系统中扮演着重要角色,相当于给计算机系统安装上“耳朵”,使其具备“能听”的功能,进而实现信息时代利用“语音”这一最自然、最便捷的手段进行人机通信和交互。

语音合成技术
语音合成技术

又称文语转换(Text to Speech)技术,它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术。语音合成技术解决的主要问题是将文字信息转化为声音信息,即让机器像人一样开口说话。

自然语言处理技术
自然语言处理技术

该技术所涵盖的研究内容非常广泛,从研究成果的表现形式来说,基本可以分为基础研究和应用两大类。
基础研究:主要指对自然语言内在规律的研究,从研究深度和难度上大致可以划分为词典编撰、分词断句、词性分析、语言模型、语法分析、语义分析、语用分析等。
应用研究:主要指基于基础研究的成果,面向不同的应用,研发相关的自然语言处理技术,大的方向包括但不限于:拼音输入法、信息检索、信息抽取、自动摘要、机器翻译、语音合成、语音识别、文本匹配、文本分类、对话系统等。

语音评测技术
语音评测技术

又称计算机辅助语言学习(Computer Assisted Language Learning),是机器自动对用户发音进行评分、检错并给出矫正指导的技术。语音评测技术是智能语音处理领域的研究前沿,同时又因为能显著提高受众对口语学习的兴趣、效率和效果,而有着广阔的应用前景。

声纹识别技术
声纹识别技术

是一种通过语音信号提取代表说话人身份的相关特征(如反映声门开合频率的基频特征、反映口腔大小形状及声道长度的频谱特征等),进而识别出说话人身份等方面的技术。它可以广泛应用于信息安全、电话银行、智能门禁以及娱乐增值等领域。

手写识别技术
手写识别技术

是一种让计算机能够“认识”用户在手写设备上书写的文字信息,将有序的笔迹轨迹转换为用户所书写的字符的技术。手写识别技术在智能手机、平板电脑等移动终端设备上为用户提供了一种较传统输入方式更为便利的交互方式。它使得不熟悉或不方便键盘操作的用户也能轻松上手使用各类电子设备。

核心技术国际领先
科大讯飞
  • 语音合成领域,科大讯飞代表着世界最高水平。自90年代中期以来,在历次的国内外语音合成评测中,各项关键指标均名列第一。不仅中文语音合成技术超过了普通人说话水平,而且在英语等多语种语音合成上牢牢树立了国际领先地位。
  • 语音识别和声纹语种领域,NIST国际评测大赛是国际上规模最大、影响力最广泛的评测比赛。它由NIST(美国国家标准与技术研究院)举办,自2000年以来已成为NIST举办的语音技术相关的常规评测项目之一,参赛单位有美国麻省理工大学(MIT),法国国家科研中心计算机科学实验室(LIMSI),捷克布尔诺科技大学(BUT),清华大学等17家国内外顶级语音研究机构。科大讯飞自2008年开始分别参加隔年举办的说话人识别和语种识别评测比赛。在说话人识别比赛上,科大讯飞于2008年荣获说话人识别评测大赛全球第一名,2010年荣获核心测试综合评价第二名;在语种识别比赛上,科大讯飞2009年荣获高混淆方言对识别指标综合排名冠军、通用测试指标综合排名亚军,2011年获9个高混淆度方言对评测中7个方言对第一名。
  • 语音评测领域,科大讯飞的智能评测系统经国家语委组织的鉴定和对比测试,结果表明“核心技术已经到达国内和国际领先水平”、“系统评分性能与国家级评测员高度一致”。目前,科大讯飞的中文评测技术是全国唯一通过国家语委鉴定并大规模实用的技术,已累计完成近千万人次的国家普通话等级考试,并在全国五千万中小学师生的课堂教学中使用。英文评测技术在多个地区的中高考等重大考试中全面应用,累计完成数百万人次的考试。在语音识别技术体系的基础上,科大讯飞创新性的研发出业界唯一可精确反应音准、节奏和歌词演唱准确度的音乐评测技术,广泛应用于相关的产品和服务中。
  • 基于声纹识别技术、语种识别技术、关键词检测等核心技术,科大讯飞在公共安全方面与相关单位开展合作,完成全国重点人员声纹库研发建设,与DNA、指纹等构成立体人物特征库,并推出国内首个实用的海量语音自动说话人识别监控系统。上述技术成果已经成功应用于国防、反恐等领域,并取得国防领域的实际战果,为国防事业做出了贡献。