刘前伟:DeepSeek:AI技术平权的双刃剑效应
奇安信副总裁、数据安全首席科学家刘前伟做《DeepSeek:AI技术平权的双刃剑效应》主题演讲。他发表了对AI与技术平权的看法,以春节火爆全球的DeepSeek为例,DeepSeek一周内180多国用户破亿,约200家行业巨头接入,因其靠创新突破算力封锁、开源改变商业格局、推动重视算法优化。技术平权有两面性,DeepSeek低成本、高性能,助力奇安信等企业,让垂直行业专注核心,数据将成竞争关键。但它也带来数据泄露、恶意利用、思维惰性、AI数据污染等风险,国家已推出治理框架。他强调,AI改变竞赛规则,发展AI时治理数据污染、重视安全刻不容缓。
以下为发言实录:
尊敬的各位领导、各位企业家朋友:
大家上午好!非常高兴也非常荣幸今天有机会跟大家分享关于AI关于技术平权我自己的一些理解。
大家都知道今年DeepSeek在春节期间火爆全球,其实科技圈里面的人可能知道的会更早一点,因为DeepSeek最早是先在海外火起来的,刚才王部长已经对DeepSeek有些介绍了,我简单跟大家同步下。
一个很重要的标志DeepSeek在全球180多个国家一周之内用户突破了1亿,这是非常厉害的一件事,在过去科技史上是没发生过的,甚至创造了一个奇迹。另外还有件事大家有些人可能注意到了,但有些人可能没注意到,在DeepSeek发布的一周内,因为当时我们都在过春节,全球大概有200家左右的行业巨头都已经接入了DeepSeek,这是一个非常具有标志性的事件。
到底什么引起了全球的关注?
第一,过去大家都知道芯片因为地缘政治的问题成了我们“卡脖子”的一件事情。在AI领域,所有的人几乎都明白一个道理,AI要想做好离不开算力、算法和数据。但是前几年下来我们看到的情况是,只要你堆算力堆芯片就能大力出奇迹。
算力至上一直是这两三年来整个科技圈里面所有人看到的事实,但是DeepSeek这家公司通过了一些科技的创新,通过了一些工程化的一些创新,像MOE、MLA创新的应用、技术,一下就破圈了,它用很小的算力将自己的模型推理能够跟全球AI的巨头OpenAI的O1达到相当的水平,这是一个非常技术标志性的事件,它证明了算法的优化可以突破算力的封锁,技术优化这件事情,是非常有必要的。
第二,DeepSeek做完这个模型随机就把它进行开源了,这也是为什么在全球180多个国家,大家可以快速接入的主要原因。过去我们为什么不敢用它?因为有一些科技巨头,它AI的模型也很好,我们通过API去调用它,但是你可能会产生数据泄露的一些问题,你不敢在上面在自己本行业深度使用。所以这件事情会产生一个很大的影响,商业格局甚至全球AI商业的格局会发生很大的变化。
第三,科技创新,不是大力出奇迹这件事了,而是所有的人想着我如何运用更好的算法,能够跑出来很好的效果,这件事情非常的重要。
尤其像我们这种做技术的,DeepSeek在全球火爆我们感到特别的骄傲跟自豪。因为很多人都知道,我们一直在很高端的技术创新上我们一直是个跟随者,DeepSeek它通过了一些科技的创新,让一些欧美国家看到了东方的神秘力量,这件事情我认为非常重要,它甚至是一种科技文化自信的输出,所以我把它叫做“一种范式转变的开端”。
国家也非常重视科技创新,在2月17日民营企业家座谈会上齐安信也有幸被邀请参加了民营企业家座谈会,31家企业里为什么奇安信能坐在第一排,能够坐在小米雷军雷总的旁边?有几点很重要。
在今天我们大谈科技创新谈新经济的时候,网络安全、数据安全至关重要,这个行业至关重要。还有一点非常重要,奇安信在这个行业的规模和科技创新我们是第一,不管是我们的收入、增速、人员、产品、投入,我们的专利是第一的,这也是为什么我们有幸参加这个民营企业家座谈会并且坐在第一排的主要原因。
第二部分跟大家聊一下技术平权所带来的“双刃剑”效应。
前面我们谈到我们通过一些技术创新打破了一些算力上的垄断甚至一些商业模式的垄断。另外开源是战略,非常重要,几乎到今天中国知名的行业的头部企业几乎全接入了DeepSeek,这会带来一个重要的变化,后面有一部分会谈到为什么大家敢这么做了。
DeepSeek能火爆到全球的另外一个原因在于它的低成本、高性能,它用很小的成本能训练出一个模型,并且它通过API的方式让大家使用时,它的价格与OpenAI、ChatGPT相比是它的几十分之一,这件事情是非常了不起的,它的成本非常低。
另外今天我们用DeepSeek蒸馏自己小模型时成本非常低,大家可以用手机去搜索一下今天会看到很多DeepSeek一体机,从算力到数据、存储各种东西集成在一个小盒子里,最便宜能做到1万块钱左右,一个中型15-20万,说大一点100万之内就可以做到,这一点非常了不起。过去小企业,中小型企业在AI的技术革命上很难参与到,这轮大家有机会了,所以成本革命会重构产业的一些格局。
第三,认知的平权。DeepSeek有一个很大的创新是把思维链进行了开发,知道推理的过程到底是什么,我们有机会将你本行业、本领域做到足够的优化进行输出,可以做到普惠大众,今天大家都可以拿出来DeepSeek搜索一下,拿出来一个AI的应用去搜索各种领域的知识,我觉得这会带来很重要的变化。
第四,生态的协同,垂直领域都可以深度参与,开发者也非常火爆。所以千行百业现在都会积极投身使用AI。
对于奇安信而言我们自身是怎么做的?我们在全面拥抱AI,过去我们有很多工程师,有近万名员工差不多6千名工程师,有一些中低端写代码的我们戏称为“码农”。正是因为这种开源的策略,高水平模型的出现,让一些“码农”即将被淘汰,我们在做人才优化的时候,中低端写代码的未来都不需要了。另外它可以帮我们写代码,帮我们写文档、写方案,帮我们去做知识蒸馏,做自己安全的大模型,做自己安全的机器人、智能体。
另外想谈到一个很重要的变化是对垂直行业,过去奇安信这种企业我们也买了不少卡,我们也要训练自己的模型,但这种投入对一个中小型企业是很难的,因为它投入的资金成本太大,所以就演进成每个行业的头部企业都在做AI全面的竞备。
因为大家都担心一件事情,会不会有一家企业拿着一个超强的AI模型,颠覆掉我行业的地位,这个是非常重要的一点。正是因为DeepSeek出现之后并且把它开源了带来的技术平权,才有机会让所有垂直行业专注于自己本行业的核心业务,这是最了不起的一件事情。如果不开源,大概率今天所有头部厂商会继续做AI这种全面的竞,所以让我们有机会去做自己安全的大模型。
透露一组数据,我们将自己过去已经有的安全大模型接入DeepSeek后,我们在性能上、在智能化上是巨大的体,也是在本周一我们与北京银行达成AI上的一个全面合作,共同推进金融行业关于AI内生安全的行业标杆。
那未来护城河到底在哪?在数据,正是我们过去这些行业头部的企业已有的一些行业的知识,行业的Know-how会变的更加重要,对奇安信而言我们有大量的海量的数据,所以我们会在大模型的基础上推出自己的智能体安全机器人,一台机器人至少相当于60个安全的专家,这样的一些能力水平,时间关系不展开。
同时技术平权也会带来一些新的风险。24年我们发布了一个人工智能安全的报告,这里面有大量数据泄露、恶意利用的问题,时间关系谈三个点:
一是,数据泄露。如果你想用好AI你就需要给它投喂数据,过度投喂数据一定会带来数据泄露,所以未来在行业里面私有化模型一定是大势所趋,因为私有化了之后我们就不再担心数据泄露的一些问题。
二是,恶意利用。人工智能给大家带来的相当于一本“武林秘籍”一样,大家都可以具备各行各业不同的知识,这是一件很麻烦的事情。今天一个普通人就可以用一个大模型去生成一段代码,他可能会正向去使用,负向的他有可能会发起一些攻击,挖掘一些漏洞,这会带来一些麻烦。
三是,思维惰性的蔓延。今天很多人看到问题之后第一件事情是问GPT问豆包问DeepSeek,我们不会再思考了,不会深度去挖掘,这是一个很要命的事情。
第二个问题是刚才王部长谈到的AI幻觉的问题,因为是生成式人工智能,AI幻觉会产生大量数据污染,如果数据污染很多,我们可以想象未来流通的是大量不正确的内容,这个是很要命的一件事情。
怎么办?国家非常重视,去年推出了人工智能安全治理的框架,覆盖的面非常广,从它内生安全的一些风险,从算法、从数据安全、从系统安全的风险,从网络、从现实域、从认知与伦理域,分别会有一些安全的风险,并且给出一定的缓解措施。
最后作一个总结,这其实是我用人工智能做的一个总结,我把我前面所有的内容喂给了它,因为这是个公开的演讲完全公开,它给出一段话我觉得写的特别好,它说这场“东方风暴”不是终结竞争,而是将战场从AI竞备转向数据价值深挖与文明形态定义,不仅改写了全球 AI 竞赛规则,更印证了《纽约时报》的评价:“当算力神话破灭时,真正的较量才刚刚开始。”
这是AI生成的一段总结特别好,但昨天我花了一天的时间去看《纽约时报》,《纽约时报》上并没有这个引号里的原文,它没有说当算力神话破灭时真正的较量才刚刚开始,这是我想跟大家最后谈到的,幻觉无处不在,数据的污染未来是治理的重中之重,人工智能高速发展的同时,我们要考虑人工智能安全的治理问题。
谢谢各位!