RELATEED CONSULTING
相关咨询
选择下列产品马上在线沟通
服务时间:9:30-18:00
你可能遇到了下面的问题
关闭右侧工具栏

技术支持

谷歌推广 > 技术支持 > 外贸推广 >

AI Challenger大赛:搜狗双赛道开放重量级数据集,用AI技术创造美好生活

  • 作者:谷歌推广
  • 发表时间:2020-05-01 12:34
  • 来源:迅龙网络

10月20日,“AI Challenger 走进传智汇•搜狗专场”在上海举行。AI Challenger是面向全球人工智能人才开放的数据集和编程竞赛平台,致力于打造大型、全面的科研数据集与世界级竞赛平台



作为发起方之一,继去年开设翻译赛道后,此次搜狗新增问答领域赛道,开放口语领域、机器阅读理解领域全球规模最大、难度最大的数据集。

 

分享会上,搜狗公司专家研究员翟飞飞、搜狗杭州研究院首席研究员张奇分别分享了搜狗在翻译及问答领域的技术研究及成果。



翟飞飞表示,“目前的翻译常见于基于一个句子进行,但实际生活中的应用范围却是场景和篇章,希望通过我们的分享,能够帮助大家在翻译上做更多探索。”张奇则对机器问答技术进行了介绍,“整个问答就是搜索加上阅读理解,搜索引擎已从‘搜关键词得链接’发展到‘搜问句得答案’的时代。” 

 

拥有庞大用户量的搜狗,积累了海量数据集,此次为大赛开放企业级数据集,一方面,有效解决了AI技术落地中数据集缺失的问题,让AI技术更加实用化地应对真实世界的问题。另一方面,为人工智能产业发掘并培养优秀人才,促进行业发展创新。

 

全球规模最大数据集,翻译体验更加人性化

 

随着全球化的不断深入,跨国交流逐渐成为常态,人工翻译门槛高、入门慢,已经不能满足人们爆发式增长的交流需求,机器翻译越来越具备成为跨语言交流工具的优势。

  

(搜狗公司专家研究员翟飞飞在会上发表演讲)

 

AI技术真正应用于翻译之前,语序错乱、翻译速度慢等问题层出不穷,人们对机器翻译的能力并不满意。



然而在实际研究中,数据的缺失对机器翻译技术的研发及落地应用带来了诸多限制和难题,机器翻译要真正应用于现实生活中,复杂的应用场景也对数据的选取提出了更高的要求。

 

2017年,搜狗作为主办方之一,在第一届AI Challenger中主持翻译赛道,开放1000万规模的中英双语数据集,吸引超2000个团队的6000名左右选手参赛



今年,搜狗再次开设翻译领域赛道——英中文本机器翻译,在去年1000万级中英双语数据的基础上,新增300万带有上下文情景的双语数据,开放1300全球规模最大的口语领域英中双语对照数据集,在开放的中英语料里,搜狗超过千万级的语料规模,仅次于联合国平行语料库(亿级)。



真实有价值的企业级数据为机器翻译的研究提供更多探索空间,推动翻译产品使用体验更加人性化。

 

企业级的数据来自于搜狗在机器翻译领域的多年积累,翻译是搜狗AI战略中的重要一环,且搜狗已取得阶段性成果突破,不仅在国际学术赛事WMT 2017中层获得中英和英中机器翻译双向冠军,并且发布了全球首次商用基于深度神经网络的同传翻译技术。



在领先技术的支持下,搜狗推出英文搜索、翻译宝pro等软硬件产品,率先推动AI翻译技术走向实用化,将技术真正落到实处。

 

全球难度最大数据集,提供更精准的答案

 

机器的使命之一是和人做沟通,如何让人和机器能够更自然地沟通交互是当前发展人工智能技术的前沿议题。



上一篇:网站优化教程, 如何快速学习SEO 下一篇: yahoo原生信息流广告计费方式