李开复称蚂蚁金服为旷视提供人脸数据：一场“口误”引发的冤案

　　编辑/梦佳、QJP

　　来源：微博

　　【新智元导读】昨天，李开复突然上了热搜，起因竟然是他在演讲中透露，旷视曾经从蚂蚁金服等公司那里拿到人脸数据，引发争议。旷视随后回应：不掌握不收集，数据安全是立身之本。蚂蚁金服也紧急否认！

　　昨天晚上，创新工场董事长兼 CEO 李开复突然上了热搜，起因竟然是一段涉及到三家企业旷视、美图和蚂蚁金服的争议言论。

　　9 月 12 日的 HICOOL 全球创业者峰会上，李开复在发言中提到，早期帮助旷视科技公司寻找了包括美图和蚂蚁金服等合作伙伴，让他们拿到了大量人脸数据，帮助他们分析各个行业怎么切入，并在随后的摸索过程中找到了几个有价值的商业化方向。

　　当时他的原话本来是「旷视科技是我们在八年前投资的一家公司，今天已经是一个很快就要 IPO 的人工智能巨头。它的发展路径是很独特的。是一批非常技术的技术人，没有任何的这种产品行业的经验，靠着自己独特的技术能力，来寻找我们创业。」

　　「早期还是犯了很多错误走了很多弯路，但在摸索过程中找到了几个非常有价值的商业方向包括安防、物流等等的领域。」

　　说漏嘴还是口误？各方迅速声明：共享 AI 技术非人脸数据

　　李开复原本想讲述的是旷视从技术到商业化路径的探索过程，强调自己在这当中扮演的角色，没想到透露了一个意思，就是旷视曾从蚂蚁金服那里拿到人脸数据。

　　事情听起来有些严重了，涉及到了用户隐私的红线。

　　蚂蚁集团率先通过微博做出回应，

　　「我们关注到李开复先生在公开场合提及蚂蚁金服和旷视科技的合作，需要澄清的是：

　　第一，蚂蚁集团在与旷视科技合作事宜上从未与李开复先生有过接触；

　　第二，蚂蚁集团从未提供任何人脸数据给旷视科技，双方过往合作仅限旷视科技授权其图像识别算法能力给蚂蚁单独部署和使用，不涉及任何数据的共享和传输。目前双方已无相关业务合作；

　　第三，蚂蚁再次重申，数据安全和隐私保护是蚂蚁的生命线，遵守法律法规、遵循用户明确授权原则和最小化原则，是采集、留存和使用数据的三条红线，在任何时候都不会违背。」

　　网友幽默评论，

　　也有人指出，充分相信阿里腾讯这个级别的公关能力和公关团队。

　　作为当事人，李开复也在当晚发表说明：

　　这一番声明侧面印证了蚂蚁金服的回应，即旷视提供给合作方的是 AI 技术，并不涉及到任何数据的共享与传输。

　　也有专业人士从技术角度分析称，提供的有可能是数据采集点（每张脸超过 80 个采集点）的信息。并不是像大家想象的把脸图直接给到。

　　旷视：数据安全是 AI 企业立身之本

　　主要相关方旷视也出面澄清。

　　旷视官微发布声明称，「我们关注到网上报道李开复先生提及旷视的言论，我们需要声明的是：

　　1，在客户合作的过程中，旷视始终尊重并致力于协助客户确保数据安全。我们不掌握，也不会主动收集终端用户的任何个人信息，这是我们的一贯原则。

　　2，数据安全是人工智能企业的立身之本。旷视一直高度重视『数据隐私安全保护』问题，并已在企业内部制定、实施了完善的数据隐私保护制度。」

　　成立于 2011 年，旷视科技是国内最早一批成立的计算机视觉技术创业公司，深耕图像识别和深度学习领域，核心的人脸识别技术已经应用于安防、金融等各个领域，又有 Face++ 开放云平台等明星产品。

　　随着人工智能技术的不断发展，如何更好地保护大众隐私数据安全将成为全行业健康发展的底线。旷视科技首席科学家孙剑曾提到，非常看好数据安全训练或者隐私安全学习。

　　在此前的采访中，谈到人脸识别技术的安全性问题，孙剑认为，任何技术没有绝对地安全，就手机产品来说，指纹识别也有不安全的地方。

　　「这其实也取决于人们的接纳程度，指纹识别刚出来的时候，很多人也担心其不安全性，但后来人们还是慢慢接纳了这个应用。」孙剑曾解释到。

　　「像人脸取款，有些银行已经开展了这个业务，但是有些银行还没有开展，也就是说人脸识别在各行各业的应用是伴随着人们逐步接纳的一个过程，并不是一蹴而就的。」

　　论数据隐私保护，网友：这个时代，数据有原罪

　　原本动机很简单，却因为一个「口误」引发了大量的舆论，和多方困扰。

　　当然关于隐私保护的讨论数见不鲜，在国内外都是如此。2018 年 3 月，数据分析公司 Cambridge Analytica 因不当取得 5000 万 Facebook 用户数据之丑闻而闻名，随后破产。

　　对用户隐私数据的保护早已不是新鲜事，可以这么说，没有了用户的隐私数据，很多软件都没有了存在的意义。

　　很多软件都不会跟用户讲道理，只要能拿到授权，就可以用自己的算法做用户画像、精准营销等，最终的目的只有一个，就是把数据转化为钱。

　　得数据者得天下，这句话对各大 AI 厂商来说一点也不为过。

　　在人工智能时代，各种模型和算法得以安身立命的基础就是数据，通过对训练集有标注数据的训练，才能在验证集上对模型不断的调优，从而在测试集上达到更好的效果。

　　虽然 few-shot learning、zero-shot learning 等需要少量数据或者不需要数据的算法和模型也在快速发展，但目前基本上都还处于实验研究探索阶段。

　　数据对于各国来说也在成为一种战略性资源，保护用户隐私数据和数据安全已经迫在眉睫。

　　苹果公司要把中国用户的数据存放在「云上贵州」，tictok 要把美国用户的数据存放在美国，Facebook 因把欧洲用户数据传回美国而遭到了巨额罚款，都是出于同样的考虑。

　　在这个数据满天飞的时代，完全的保护用户隐私数据还有很长的路要走。也许目前我们真正需要思考的是，如何保证用户的隐私数据不被滥用，以及用户是否同意通过提供部分隐私数据，来换取更便捷高效的生活。