首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

警惕开源之上的人工智能产业风险

2019年世界人工智能大会于今日(8月29日)在上海世博中心开幕,中共上海市委常委、上海市常务副市长陈寅与工业和信息化部副部长王志军为上海(浦东新区)人工智能知识产权国际交易中心揭牌,人工智能发展面临新的重大机遇。

近几年,上海乃至全国的人工智能产业发展非常迅速。基于庞大的数据资源,国内的AI公司在各种场景应用上具备得天独厚的优势。但现阶段,这种迅速的发展主要都集中在应用层面,当然从投资角度来看,应用层面的投资无疑更易获利。但在我国人工智能应用层面全面开花,实现跨越式大发展的同时,人工智能产业底层的技术框架和基础算法领域,我国却还与国外巨头们存在着明显的差距。目前我国应用层面的繁荣都是建立在大量使用国外人工智能的开源框架和算法基础之上,国内人工智能的企业几乎都采用“拿来主义”直接在国外“开源”地基上直接盖楼。

何为“开源”?即指将技术的源代码开放出来,让所有的开发者能够了解、使用、优化,免去从底层搭建技术。安卓就是谷歌开发的一款开源可用于移动设备的操作系统,使用这种“半成品”无疑能免去费时费力的底层建设。自从2013年伯克利大学宣布开源深度学习框架Caffe;2015年11月Google开源了深度学习框架TensorFlow;2015年11月IBM宣布开源机器学习平台SystemML。国外巨头都在通过开源的方式打造自己的人工智能生态圈,通过开源的方式掌握和控制人工智能行业的标准及大量相关数据资源的拥有权。2017年谷歌甚至收购了机器学习开源社区Kaggle;2018年微软也收购了全球最大的代码托管平台GitHub。可见各巨头对于开源生态的战略重视程度。

目前常看到国内企业对于正在使用或已经使用的开源软件可能带来的风险并不清楚,误以为开源的就是免费的、公有的;或认为源代码公开的就是开源软件,这样不管不顾的拿来主义,必然会在未来产生一系列法律风险问题。

首先使用开源软件第一步就是要弄清其适用的开源许可协议是什么?目前OSI开源软件许可协议已有80多种,其中常见的开源许可协议包括:Apache、GUNGPL、MPL、BSD等。这些协议一般都是围绕着代码的版权声明以及修改后是否可闭源等问题,当然有些还规定了涉及专利的条款。

根据2019年云计算开源产业联盟的《开源产业白皮书 (2019)》及2019年7月中国信息通信研究院的《开源软件知识产权风险防控研究报告(2019年)》对于常见开源许可证的分类,笔者梳理了如下热门开源软件及其应用的许可证,如下表:

针对那么多种多样的开源许可证,企业又应从哪些方面着手进行预防和控制开源软件带来的风险呢?

第一、了解开源软件的开源协议

要详细阅读开源协议,按照开源许可协议来履行,如果违反了许可协议则可能被停止许可。还要了解许可证的传染性情况,即是否由于使用开源软件而必须开源自己的软件。

如GPL许可证规定,使用其软件并涉及到修改和分发,需将后续修改代码全部开源。2009年Cisco销售的路由器中包含涉及GPL和LGPL许可证所涵盖的软件,但是并未提供完整及相应的源代码。自由软件基金会(FSF)认为其行为违反了GPL许可协议。此案最终解决方式为Cisco为其路由器拥有的Linksys指定了监管机构,并告知购买Linksys产品的人GPL许可协议对他们意味着什么,许可证通知被添加到Linksys的网站,相关的源代码也在其网站上公布。

第二、特别关注开源协议的专利条款

要关注许可协议中有关专利权的许可条款,如GPL2.0和很开放的BSD、MIT开源协议,都未在协议中明确专利许可条款,换言之在使用依据BSD、MIT、GPL2.0协议软件代码时,还要警惕可能出现的专利侵权风险。

简单以采用BSD 协议的“Caffe ”与“人工智能”作为关键词进行检索,已有500余件专利申请,其中在中国的申请高达300多件占60%以上,无疑是世界最火的申请地,可以预见未来中国会成为专利侵权诉讼的大战场。下图为排名前10的申请人的专利技术领域图:

按申请人的关联集团公司及其技术申请的方向分类可见下图:

(数据来自incopat,检索时间 2019年8月26日)

由上图可见,乐金、英特尔、阿里巴巴、腾讯等都对于人工智能的专利布局十分重视。这既是为了防御,也是为了在未来人工智能领域拥有重要的标准制定权。开源软件的背后还有专利的利器不得不防。

当然各开源协议中还要重视专利严格的终止许可或报复条款。

例如百度弃用Facebook的React开源软件,原因在于开源许可协议包括专利授权协议,规定如果获取者开始对Facebook及其关联方提起专利侵权诉讼,则包括专利许可在内的开源许可协议终止。

第三、排查各许可证的兼容和冲突问题

对于使用过的开源代码应进行梳理、监控,避免在同一软件产品中出现开源许可冲突的代码。

例如:在2017年的Artifex vs. Hancom案中,Artifex是Ghostscript软件的权利人,Ghostscript使用了两种许可证,一种是GPL许可,另一种是付费的商业许可证。在商业许可下,可以将代码用于自己的目的,并保留所有源代码。在GNU AGPL下必须免费分发对Ghostscript所做的任何更改。Artifex对韩国公司Hancom提起诉讼,称Hancom在其产品中使用了Ghostscript。法院认为GPL既是一种许可,可以通过侵犯版权的请求来强制执行,也是一种合同,可以通过违反合同的请求来强制执行。因此,AGPL与商业许可证冲突时,法院还是支持了AGPL的开源条款。

第四、注意开源许可协议的规则变化

开源软件还可能出现开源许可协议类型的变化和条款变化的情况,如企业没有关注和及时变化,将会导致法律风险。

例如:2018年10月, MongoDB将其开源许可协议从AGPLv3变更为 Server Side Public License (SSPL),引发了对于云服务商应用的影响。因为SSPL协议明确规定将程序或其修改版的功能作为服务向第三方提供时,需提供“服务源代码”,而原来AGPL v3协议中与用户通过网络进行远程交互,就需要提供源代码给用户,实践中出现了云服务厂商将MongoDB版本修改后向用户提供数据库的托管商业版本,而不将修改的源代码反馈社区。云服务商在变更许可协议后,需要完全公开其服务源代码或向MongoDB购买商业许可。

第五、使用的开源软件应及时更新补丁避免出现安全风险

与商用软件会向用户自动推送修复包、补丁和更新不同,开源软件需要使用者进行跟踪修补,不然容易成为病毒攻击的对象,并造成数据信息泄露等严重安全风险。同时还要注意使用的开源代码是否还在被维护中,不然也将引发安全风险。

一项开源项目除了有开源协议,还有代码托管平台和开源基金会等方面的风险存在。开源许可证关联的是知识产权,一般与出口管制和司法管辖权无关。而开源项目属于开源基金会,受到开源基金会的管理约束。例如:Linux基金会自身不受美国出口管制;Apache基金会管理办法中明确遵循美国出口管制;Mozilla基金会明确司法管辖权是美国加州;RISC-V基金会隶属于Linux基金会,没有声明受美国出口管制,但指明司法管辖权在美国特拉华州。而目前主流的代码的托管平台GitHub、SourceForge、Google Code均明确声明遵守美国出口管制条例,且司法管辖权均在加州。

由上可见,开源软件由于其开源基金会和代码托管平台的原因,开源软件本身存在受到美国政策监管的风险,一旦美国的政策监管发生变化,在其监管下的我国企业使用开源软件可能会受到影响。前段时间的“华为事件”无疑为国内相关企业敲响警钟。

国内人工智能开源软件的情况

国内巨头也在积极布局人工智能产业,2016年9月百度将其深度学习平台PaddlePaddle开源;2017年6月腾讯的Angel分布式计算平台开源;科大讯飞、阿里等公司都开放了自己的技术平台,打造自己的人工智能生态圈。就在8月23日华为也正式发布最新AI处理器昇腾910及全场景AI计算框架MindSpore。

在国外的开源社区中来自中国的贡献者也活跃地贡献自己的力量,2018年在GitHub中国的贡献者数目和新增用户数目都仅次于美国,名列第二。

在此仅就中国丰富多样、蓬勃发展的人工智能行业提出几点建议:

一、 搭建拥有核心代码的人工智能平台,推进开源的项目托管平台、开源基金会的国内化

核心技术应当掌握在自己手中,盲目依赖国外开源软件难免受制于人。我国人工智能行业的发展既要注重参与国外巨头的深度学习开源平台,更要将搭建国内自己的深度学习平台作为重要的发展方向。可以采用国内多巨头集中联合发展的方式设计多融合的人工智能技术平台、框架和应用软件,也可以积极探索与海外巨头开源平台兼容的发展模式。对于开源项目的托管平台、开元基金会等应加快国有化,避免由于美国的出口管制和司法管辖权影响人工智能行业的高速发展。

二、各企业应开展人工智能的专项风险评估

人工智能企业应对于使用的开源软件的情况,做一个全面、综合的梳理,并在此基础上进行专项评估。明确企业是否存在法律、安全等风险,风险具体在哪里,对于风险进行预防、监控和备案准备,避免风险出现时企业陷入困境中。要做到提前做到心中有数,以防万一,未雨绸缪。

三、正确认识开源软件背后可能存在的专利侵权风险

有开源协议并不必然意味着实施其代码就获得了贡献者们的专利许可。上述的多种开源协议下,不少具有专利的侵权风险。采用各种开源代码前要进行详尽的了解、评估和规避,避免触发专利侵权。

当然各企业也可以加入开源发明网络(OIN),通过OIN 专利许可和会员的专利交叉许可对所有 OIN 社区会员免费开放来规避专利风险。

我国建立在开源软件盛宴上的人工智能行业要清醒了解目前存在的各种法律风险,积极探索自有核心技术的人工智能生态圈。人工智能的发展是一次科技变革的机遇和挑战,中国企业应利用好丰富的应用场景及数据资源的优势,为在未来世界的人工智能行业的长期竞赛中胜出做好最基础的准备。

参考资料:

1、2019年7月云计算开源产业联盟的《开源产业白皮书 (2019)》

2、2018年12月中国信息通信研究院、中国人工智能产业发展联盟的《人工智能发展白皮书产业应用篇(2018年)》

3、2019年5月中国开放指令生态(RISC-V)联盟的《开源项目风险分析与对策建议》

4、2019年7月中国信息通信研究院的《开源软件知识产权风险防控研究报告(2019年)》

5、2019年Synopsys网络安全研究中心的《2019年度开源安全与风险分析报告》等

作者简介

游闽键

上海市协力律师事务所律师

主要致力于版权、商标、专利IT法律、网络与电子商务、公司金融、知识产权融资交易等领域的法律工作。

上海市十一、十二、十三届政协委员,上海知识产权研究所高级研究员,上海市文化创意产业协会副会长、上海市版权协会副会长,浦东新区专业机构从业人员联谊会会长,上海市社联委员,世界知识产权组织(WIPO)仲裁与调解中心调解员及仲裁员、上海国际仲裁中心仲裁员。

2003年获得上海市十佳青年律师和上海市新长征突击手称号;2007年获得首届东方大律师称号;2008年当选全国优秀律师;2009年获上海市司法行政系统个人三等功;2013年获“国家实施知识产权战略实施先进工作者”并入选“中国律师行业新闻人物”;2015年获“上海市劳动模范”、“全国劳动模范”荣誉称号;2017年荣列LegalBand中国顶级律师排行榜知识产权第一梯队律师、“ALB中国十五佳知识产权律师”;2018年荣列第五界强国知识产权论坛“年度十佳知识产权大律师”、LegalBand“知识产权诉讼第一梯队律师”、MIP“商标领域IP Star”、2018上海市统一战线(工作)先进个人荣誉称号。

郑鸣捷

上海市协力律师事务所律师

郑鸣捷律师拥有十多年的专利领域经验。她曾担任国家知识产权局专利审查员、专利复审委员会审查员。在专利案件分析和检索方面具有优秀的素养,特别是在光电、电子和通信技术等领域。

郑鸣捷律师加入协力后,曾代表许多著名公司进行专利案件诉讼。她还被强国知识产权论坛评选为2017年度“十佳”专利律师。

(本文为授权发布,未经许可不得转载)

近期活动 1

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190829A0PP5T00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券
http://www.vxiaotou.com