SKYSUKA's Studio.

人工智能每周分享第4期

字数统计: 2.1k阅读时长: 7 min
2020/03/09 Share

MolarData人工智能每周见闻分享,每周一更新。点击标题,可查看更深入报道

超越谷歌、微软、Facebook,阿里AI登顶GLUE榜单

在近日公布的全球自然语言处理领域顶级赛事GLUE Benchmark中,阿里巴巴达摩院以平均分90.3分的成绩夺冠,刷新自然语言理解技术世界纪录,超越同场竞技的Google、微软、Facebook、斯坦福大学等企业和高校团队。

自然语言理解是人工智能的核心技术之一,GLUE Benchmark(通用语言理解评估基准)比赛排名是衡量自然语言理解技术水平的重要指标。比赛设置了自然语言推断、语义相似度、问答匹配、情感分析等9项任务,最后按平均分综合排名。达摩院NLP团队取得了CoLA、MRPC、QQP、WNLI等4个任务的最佳效果,以平均分90.3分位列第一,显著超越人类水平(87.1分)。

Google于2018年底推出的BERT模型是业界广泛使用的自然语言预训练模型,达摩院NLP团队在BERT的基础上提出优化模型StructBERT,能让机器更好地掌握人类语法,加深对自然语言的理解。据阿里介绍,这一技术已广泛使用于阿里旗下阿里小蜜、蚂蚁金服、优酷等业务。阿里达摩院的语言模型和阅读理解技术也被用于行业赋能,推进AI技术在医疗、电力、金融等行业的落地。

来源:DoNews

Google更新最大的带注释图像数据集,添加本地化叙述

近日,Google AI 宣布发布 Open Images V6,和 V5 版本相比,它极大地扩展了 Open Images 数据集的注释,增加了大量新的视觉关系(例如,「狗抓飞盘」)、人类动作注释(例如,「女人跳跃」)和水平图像标签(例如,「paisley」)。

Open Images V6 网址:https://g.co/dataset/openimages

来源:AI源创评论

「打造中国人自己的开放 AI」:清华教授唐杰宣布成立AI新期刊

清华大学计算机科学与技术系教授唐杰在社交媒体上宣布,他们成立了一个新期刊——《ai open》,专注 AI 的开放共享。该期刊的内容可以免费获取。此举得到了刘知远、刘群、马少平等国内研究者的支持。《ai open》是一个共享 AI 理论与应用知识和前瞻性观点的免费开放平台。期刊接收的内容包括研究文章、综述论文、观点、交流性短文和技术说明,范围覆盖 AI 及其应用的方方面面。

期刊官方介绍:keaipublishing.com/en/journals/ai-open/

在过去的两年里,这种因签证问题无法参会的问题层出不穷。为此,ICLR 组委会甚至将 2020 年的会议举办地选在了非洲。参会受阻只是一个方面,国内学者在其他方面也面临着学术交流受阻的困扰。这也是《ai open》诞生的一大契机。

来源:机器之心

那个引发 Waymo、Uber 世纪大战的自动驾驶明星工程师,破产了

曾经的硅谷自动驾驶明星少年,引发 Waymo、Uber 两家巨头对簿公堂的 Anthony Levandowski 最终还是没能躲过 Waymo 的穷追猛打。

自动驾驶热潮勃兴以来,Levandowski 窃密案可谓业内最引人注目的大戏。作为打车行业无人能跨过的山峰,Uber 前 CEO Travis Kalanick 想用自动驾驶来换取未来 Uber 业务的持续盈利。就在此时,Levandowski 从谷歌出走创办 Otto,后又迅速被 Kalanick 花 6.8 亿美元重金收至麾下。两人一拍即合,而 Levandowski 的新任务就是带着 Uber 跟老东家作对。可惜好景不长,自动驾驶领头羊 Waymo 才不想被 Uber 迅速追上,它们以 Levandowski 盗窃商业机密为由将 Uber 告上法庭。最终,Uber 不得不开除 Levandowski,并在 2018 年与 Waymo 取得和解,赔给对方价值 2.45 亿美元的股票。

3月6日,有消息称加州法庭判决 Levandowski 需赔偿 Waymo 1.79 亿美元。由于资不抵债,Levandowski 随后就申请了破产保护。作为谷歌自动驾驶项目的元老之一,Levandowski 在破产申请中坦诚,自己的资产价值 5000 万- 1 亿美元,债务则达到了 1-5 亿美元。在离开谷歌创业前,他则从老东家那里拿到了大额奖金,价值超过 1.2 亿美元。

Levandowski 的代理律师 Neel Chatterjee 则强调,这次的诉讼跟商业机密无关。“它会影响那些准备离开谷歌寻找新机遇的雇员,而 Anthony 则是两大科技巨头纷争的牺牲品。”

不免让人想起当年李开复离开微软来到谷歌,微软当年对李开复提起诉讼,一部分原因也是为了影响那些准备离开微软去谷歌寻找新机遇的雇员。

来源:雷锋网

MIT文本转语音神器,少量数据集还原角色声音

工具地址:https://fifteen.ai/app

文本转语音,又出了个神器。这个工具来自MIT,并且还是在线、免费,可以用它来生成各种字符的44.1 kHz声音。这些声音是使用多种音频合成算法和定制的深层神经网络实时生成的。最惊艳的是,这个工具只需要少量的文本数据,还能保留文本所表达出来的韵律,可以说是相当的“声情并茂”了。

当然,我们也可以从一些例子中听出来,出来的声音并不是完美的,作者对此也做出了解释。

这个工具生成音频文件的采样率为44100 Hz,而大多数深度学习文本到语音实现使用的是传统采样率,为16000 Hz。所以有些句子听起来像机器人或者声音比较嘶哑。

和标准数据集相比,字符数据集非常小,标准音频通常有超过40小时的对话,包含许多不同的词汇。而这个工具的字符数据集,每个字符只有30至120分钟的对话。所以有些字发音不正确。

来源:量子位

AI 2000 人工智能全球最具影响力学者榜单:美国领跑,中国第二,德国第三

AI 2000网址:https://www.aminer.cn/ai2000

AI 2000 人工智能全球最具影响力学者榜单(以下称为 AI 2000)由清华大学研发,依托于唐杰教授所开发的学术搜索引擎Aminer,通过计入过去 10年内学者们在各大AI顶会和期刊中发表论文的引用率来进行评估。不同于CSRankings以“论文数量”为唯一标准,AI 2000的评选主要以发表在核心顶会和期刊上论文的引用率为主,这也在一定程度上能够体现一个学者的“学术影响力”。

AI 2000检索了19世纪以来全球1亿3千余万学者发表的2亿7千万余篇学术论文数据,已吸引全球220个国家/地区1000多万独立IP访问,数据下载量230万次,年度访问量超过1100万。

来源:运筹OR帷幄

CB Insights年度AI100全球榜单官方首发!6家中国公司入选

从 2017 年 CB Insights 首次发布,如今 AI 100 已经来到了第 4 届,见证了全球多家 AI 创企的追赶起伏。2020 年的 AI 100 榜单同样颇具亮点,榜上有名的公司涵盖了语音合成、量子机器学习、蛋白质建模等方向的重要玩家。

具体的评定标准包括专利布局、投融资概况、CB Insights 独立开发的 Mosaic 算法、市场潜力、媒体关注、合作伙伴关系、竞争格局、团队实力和科技新颖性、最近一年取得的公开的技术成果等多个因素。

最新的 2020 AI 100,中国公司上榜数量与去年持平,同时也出现了新面孔,上榜公司分别是: 创新奇智、禾多科技、追一科技、第四范式、松鼠 AI、蓝胖子机器人。

来源:DeepTech深科技

CATALOG
  1. 1. 超越谷歌、微软、Facebook,阿里AI登顶GLUE榜单
  2. 2. Google更新最大的带注释图像数据集,添加本地化叙述
  3. 3. 「打造中国人自己的开放 AI」:清华教授唐杰宣布成立AI新期刊
  4. 4. 那个引发 Waymo、Uber 世纪大战的自动驾驶明星工程师,破产了
  5. 5. MIT文本转语音神器,少量数据集还原角色声音
  6. 6. AI 2000 人工智能全球最具影响力学者榜单:美国领跑,中国第二,德国第三
  7. 7. CB Insights年度AI100全球榜单官方首发!6家中国公司入选