最近,“新基(jī)建”真(zhēn)是火(huǒ)出了圈。尤其是3月4日,中央政治局(jú)常委会会(huì)议研究当(dāng)前新冠肺炎疫情防(fáng)控和(hé)稳定经济社会运行重点工作(zuò),其中(zhōng)提出“加快5G网络、数(shù)据中(zhōng)心等新(xīn)型(xíng)基础设施建(jiàn)设进度”,为“新基建”摁(èn)下(xià)快进(jìn)键。事实上,“新基建(jiàn)”不是一个新概念。2018年(nián)底召开的中央经济工作会议就明确了(le)5G、人工(gōng)智能、工(gōng)业互联网、物联网等“新型基础(chǔ)设施建设”的定(dìng)位,随后“加强新一代信息基础设(shè)施建设”被写(xiě)入2019年政府工作报(bào)告。2020年开年的首次国务院常务会议也(yě)明确提及“新基建”。
在当前(qián)疫情防控(kòng)和经济恢复的大背景下,由于在稳定投资等方面的巨大作用,“新基(jī)建”进入一个加速推进的快(kuài)车道。
华为,清(qīng)华大学,旷(kuàng)世等人(rén)工智能企业开源,推动新基建(jiàn)发展(zhǎn)3月20日,清华大(dà)学(xué)计(jì)算机系图形实(shí)验室开(kāi)源AI框架计图(Jittor),这是由中国(guó)科学界(jiè)开源的首个AI框架。接着3月25日(rì),旷视科(kē)技(jì)在线上发布旷视AI生产力平台Brain++,同时(shí),也宣(xuān)布开源新一代AI生(shēng)产力平台Brain++的核心深(shēn)度学习框架旷(kuàng)视(shì)天元(MegEngine)。紧接着28日,华为在(zài)2020年开发者(zhě)大会中宣布正式开源(yuán)一款支(zhī)持端边云全(quán)场景的(de)深度学习训练推理框架(jià)MindSpore。
其实,开源深度(dù)学习框架的重要性不言而(ér)喻。在传统深度学习研发中,产品从原型到生产部署往往需要分开设(shè)计并调用训练框架和推理框架两种框架(jià),这就导致模型(xíng)在训练和推理的转换的过程中容易出现不明原因(yīn)的性(xìng)能或精度损失,需要开发者手工进行优化(huà),而算法在计(jì)算平台部(bù)署的时候出现的(de)各(gè)种问题也(yě)无法追溯(sù)。
针对以上问题,开(kāi)源(yuán)框架在设(shè)计之初就可以(yǐ)很好规避,它不仅(jǐn)可以降低AI开发门槛,还可以提升算法研发效率。
开源(yuán)意义:技术开放与AI快速落地
那么,什么是开源深度(dù)学习框架?
在讲述(shù)深(shēn)度学习框架之前(qián),首先(xiān)先了解深度学习。
大多数人对(duì)于深度(dù)学习并不陌生,深度学习即Deep Learning,源于人(rén)工神经网络(luò)的研究,是机器(qì)学(xué)习的一个分支,它主要(yào)依赖于(yú)深度(dù)神经元网络(luò),这种深度神经元(yuán)网络就(jiù)类似于人类的大(dà)脑(nǎo),其学(xué)习过程(chéng)也与人类极其相似,并且还可以用(yòng)海量的数据和(hé)高级算法来(lái)提高自主学习与(yǔ)分析事物特征的能力(lì)。
而开(kāi)源深度学(xué)习框(kuàng)架(jià)则是(shì)在深度学习(xí)初始阶段(duàn)基础之上,由深度学习(xí)研究(jiū)开发者将大量(liàng)重复(fù)代码写(xiě)成一(yī)个框架,然后放(fàng)到网(wǎng)上(shàng)让所有其他研究开发者(zhě)一起使用(yòng),主要(yào)是为了提高研究(jiū)开发者的工作效率。
所以,“开(kāi)源”就意味着开放自己(jǐ)的(de)源代(dài)码给别人查阅和使(shǐ)用,开发者可以将开源(yuán)框架用在任何平台,任(rèn)何领域里。例如,如果有(yǒu)图像数据(jù),就可(kě)以将(jiāng)开源框架用在图像识(shí)别领域,如果有语音数(shù)据就可以(yǐ)将(jiāng)开(kāi)源(yuán)框架用(yòng)在语音识别里(lǐ)等等。对于(yú)使用者而言,开源框架即拿即用。
早前,百度高级副总裁、AI技术平台体系总负责(zé)人王海峰就(jiù)表示:“开源、开放(fàng)对(duì)于人(rén)工(gōng)智能时代至关重要(yào)。首先,人(rén)工智能技术(shù)的发展需要(yào)所有人的(de)协同推进,因(yīn)此开(kāi)源(yuán)、开放就显得特别重要;其次,人工智能技术会赋能(néng)各行各业(yè),开源、开放可以让各行(háng)各业便捷(jié)地使用人工智能,让社会各(gè)界都受益”。
旷视科(kē)技则把开(kāi)源框架做了一个很好理(lǐ)解的比喻,他们向笔者称,开源(yuán)框架的作(zuò)用就(jiù)是为开发者提供一个良好的开发(fā)环境(jìng),如果把算法(fǎ)研发比做(zuò)炒(chǎo)菜的(de)过程,有无框架(jià)的(de)区(qū)别就是,现(xiàn)在不需要厨师自己(jǐ)去造锅(guō)、生火和洗菜,直接炒(chǎo)菜就可以了。

旷视科技天(tiān)元开(kāi)源(yuán)框架
“开源框架就是让研发人(rén)员获得从数据到(dào)算法产(chǎn)业化(huà)的一揽子技(jì)术(shù)能力,不用重复(fù)造轮子也可(kě)以推进(jìn)AI快速落地。”旷视科技表示。
对于开发者来说,“开源”最大的意义就在于其“技术共(gòng)享(xiǎng)与(yǔ)共建”。旷视科技介绍,“20世纪末期,Linux 系(xì)统为中国开发者打开了通往开源“集市”的大门(mén),开源软件为国产操作系统(tǒng)和国产(chǎn)软件平台从0到1开辟了基(jī)础,同时中国的开发者们也(yě)为国际的开源社区做出了大量的贡献”。
开源社区的发展壮(zhuàng)大和成果共享,促(cù)使(shǐ)很多企业(yè)实现了快速的成(chéng)长(zhǎng),同时(shí)也触发了技术的加(jiā)速迭代,和大批信(xìn)息(xī)技术(shù)人才的涌现(xiàn)。
开源:利于企业生态化,加快新基建步伐
据笔者了解,在旷视、华为等发布开源(yuán)之(zhī)前,早在2016年,百度就开放了自主研(yán)发的开(kāi)源PaddlePaddle深度(dù)学习平台(tái)。据了解,百(bǎi)度(dù)PaddlePaddle是国内最早的开源(yuán)深度学习框架,并(bìng)且打破了国产AI框架的开源(yuán)。
除(chú)百(bǎi)度(dù)开源PaddlePaddle外,还(hái)有脸(liǎn)书Torch、蒙特利(lì)尔理工(gōng)学院Theano、谷(gǔ)歌Tensorflow、腾讯(xùn)Angel、阿里X-DeepLearning等。据悉,目前(qián),全(quán)球市场被脸书Torch、谷歌Tensorflow占据了(le)90%以上的开发(fā)者市场(chǎng)。
笔者查询资料获(huò)悉:此前(qián),百度相关人士(shì)曾对(duì)媒(méi)体介(jiè)绍道“深度(dù)学习(xí)框架(jià)就像智能时代的(de)操作系统,它(tā)向(xiàng)下(xià)连接芯片、大(dà)型计算(suàn)机(jī)系统,向上(shàng)承接各种(zhǒng)业务模型(xíng)、行业应用,在生态中处于核心位置,如果一直基于(yú)海外谷歌和Facebook的框(kuàng)架,等着别人开放功(gōng)能,会(huì)丧失(shī)率先(xiān)打开未知(zhī)领域的机会”。
同时(shí),如(rú)果只偏(piān)重在上层应用、忽视了底层技术(shù),国内底层人才将空(kōng)心化。
亿欧智库产(chǎn)业互联网研究副总监(jiān)薄(báo)纯敏(mǐn)也向笔者表示(shì):“目前,国内研发开(kāi)源深度学习框架的企业比较少,而且(qiě)也没(méi)有非常核心的(de)开源深度学习框(kuàng)架,市场几乎被(bèi)谷歌与(yǔ)脸书占据”。
她分析,国内企业开发开源框架主要有两个(gè)原因:第一(yī)、大公司想要通过开源框架建立企(qǐ)业(yè)生态化;第(dì)二(èr)、大公(gōng)司建立完生态化后,希(xī)望(wàng)通过(guò)技术或产品的开源,去获取想要(yào)的数据资源,然后(hòu)对这(zhè)些数(shù)据进行分(fèn)析与整合,再利用。
开源的本质是开放,而(ér)目前开源是被大多数企业当作战略来(lái)发展的,因为所有行业最终的目标(biāo)就是通过(guò)开放实现(xiàn)生态化(huà)。就(jiù)拿(ná)腾讯来说,第一步,它是通过开(kāi)放来进(jìn)行企(qǐ)业生态化;第二步(bù),则是通过(guò)生态来给(gěi)社会、企业等提供开源框架的解(jiě)决方案。
除(chú)此之外,开源框架对初进入AI行业的初创公司而言,可以很好降低最开始的(de)研究基础门槛;对于本身就对AI技术(shù)比较感(gǎn)兴趣的爱好(hǎo)者而言,他(tā)们不一定会商(shāng)业化(huà),他们可以会通过开源框(kuàng)架做(zuò)一些小的系统研发。不(bú)仅如(rú)此,开源框架还(hái)可(kě)以(yǐ)构(gòu)建全社会技(jì)术共享的大生态。
在(zài)笔者看来,AI作为新基建中的一部(bù)分,开源深(shēn)度学(xué)习框架(jià)进(jìn)一步加(jiā)速(sù)了AI技术落地(dì),这对于(yú)最近(jìn)大家比较关注的新基建(jiàn)项目也有很大促进作用,AI 加速(sù)落地在一定程度上,也可加快新型基(jī)础设施建设(shè)的步伐。旷视科技表(biǎo)示:“通(tōng)过开源(yuán)、开放(fàng)的(de)方式,可以让每(měi)一个AI开发者都有能力快(kuài)速实现算法(fǎ)从0到1的创造(zào),进而创造更大的价值”。
不过,从目(mù)前(qián)的现实情况来看,开源深度(dù)学习框(kuàng)架(jià)确实可以给AI行业技术落地带来促进作用,但是也会导致(zhì)一些底层技术(shù)研发(fā)的滞后。薄纯敏(mǐn)称,“这就好比现在大家用的手机(jī)一样,大部分都局限于androids与ioses系(xì)统,这些系(xì)统本身很好(hǎo),大家都可(kě)以(yǐ)用,但是却不利于(yú)行业底层技术(shù)的(de)多元化发展”。
开源框架(jià)的使用也(yě)一样,当开(kāi)源框架开放后,大(dà)家就会(huì)拿(ná)来即用,会停留在一些(xiē)开源框架中(zhōng),而不去(qù)思考、不(bú)去(qù)进行更深(shēn)层次的多元化开源(yuán)底层技术研发(fā)。