2015/7/13 下午12:06:19 星期一
当前位置: 主页 > 周而复始 >

杜小军:中润普达在人工智能语义识别领域的成果
时间:2019-05-31 12:49

杜小军:中润普达在人工智能语义识别领域的成果

时间:昨天 阅读:4242次 转载来源:搜狐财经

原标题:杜小军:中润普达在人工智能语义识别领域的成果

“2019中国智能产业论坛”于2019年5月30日在北京举行,本次活动为京交会论坛活动之一,主题为:“智能+”引领未来,北京中润普达(集团)有限公司联合创始人、CEO杜小军出席并演讲。

以下为演讲实录:

杜小军:非常感谢再这样一个场合和机会,我想向和大家一块分享一下我们这个团队在人工智能的语义识别方面近两年一些新的成绩,我记得去年在第二十届我们深圳的高通技术交易会上,我们中润普达在中文语义识别方面正在苦苦的探索,到今天我可以把这两年新的一些成果跟大家作一个分享和汇报。

我们公司核心技术是围绕中文语义识别,我们看到认知计算是泛人工智能核心技术之一,在这领域希望机器去理解解释规划可以演绎归纳具备这样一些可能,这当然是我们的一个想法或者是我们一个目标。

为了实现这一个想法和目标,当前的很多工作尤其是技术研发还是比较困难的。我们近两年投了将近两三个亿的资金,在这方面深度的做一些工作,坦率的讲确实我非常认可包括微软同事说的一样,越往前走感觉难度越大,你比如说语义这里面任何一个问题,我们期望机器人去理解让机器人推意归纳,从表面上我们都有可能,我们有很好的技术我们有深度学习我们有知识图谱,但是要达到这一些可能短期我们也觉得都还有一定的距离。但是我们必然往前走,我今天就想重点介绍一下,我们在实现这样一个问题上的路径是什么?

我们认为认知智能是AI发展的焦点,也是释放AI产能的关键。在这领域我们过去看到计算智能,它里面非常有明确的规则,也适合我们现在的一些特定的领域,也就是当我们数据足够量大的时候,数据规则足够清晰的时候,计算智能应该是发展非常快的,逐步过渡到IOT就是现在感知智能这一块,像语音、图像、视频尤其随着边缘计算和我们计算能力的提升,这一块目前应该是发展非常快的。

非常值得一提的是,我们选择在认知智能这一个领域,不断的进行突破,可能在理解、推理解释方面,让机器具备人一样的思维能力,这个就是软件。这个里面包括刚才徐总也提到了我们说的人工智能应该像人一样,我们把它加了另外一个词应该说是像人一样去思考,怎么做到这一点呢?

我们看到有几个条件来让我们距离这一种可能,第一是海量的数据,为机器学习提供了养料,我们看一下互联网技术让我们衣食住行行业的互联网化、数据化在这过程当中产生的数据是海量,无论是数据是结构化还是非结构化但是它必然给我们提供了一个可能,就是这一些数据让获取可能性更大,我们中普下面投资和控股了4个交易中心,分别是中普大数据交易中心、前潮大数据中心、还有江苏省大数据中心还有国家大数据服务平台。为什么要参与这一些产业的布局呢?核心就是为我们未来得机器提供足够多的有价值的这种海量的数据,这也是我们在这产业的布局中思考。

人工智能的产品落地离不开海量数据(603138)的养料,贡献于机器过程中不断训练和优化算法模型,我也非常认同包括今天韦博士提到的一样,我们过去太强调算法,所以我们周边的同行坦率地讲大部分都是以算法为主,只有我们默默这几年至少走了将近5年的时间,聚焦在我们的以数据为主、同时这一些数据有很多还是非结构化数据,我们在这领域寂寞了5年,也是在技术方面一直不断的进行积累。应该说是通过这样一些积淀有一些相应的出来成绩或者是出来一些相关的应用,我等一会给大家作一个简单的汇报。

这里面海量的数据我们可以看到像大健康行业,这已经是比较客观了。像诊疗服务阶段、还有咨询服务阶段、信息服务阶段这一种大健康行业的数据,现在已经应该说是整个我们智能机器这一块需求非常大的,也是比较直接的。我们看到亿欧智库发布了一个报告2020年人类产生的医疗数据总量达到40万亿的GB,这个数据规模挺大的,但是问题是不是都内被我们的机器识别,是不是都能服务于人工智能智能化的场景应用里面去,这是当前我们碰到的一个核心问题。

非结构化认知能力赋予我们智能+更多的智能可能。一种说法是比如我们现在基于结构化数据,也就是我们的这种逻辑结构非常清晰的数据,这构建了我们智能+基础的一些应用场景。但是我今天想提的是,基于非结构化数据照样在这领域我们不可能完全脱离掉非结构化数据,必然把结构化数据、非结构化数据融合起来,让我们的机器具备一定的认知计算能力。我们认为认知计算目前有三大商业应用,一个领域是产品的应用将认知计算嵌入到我们的传统产品里面去,比如说爱国者很多产品里面去,来实现智能的行为、自然的交流以及自动化这也就是我们说的把我们的人工智能和我们的产品结合起来。