数安行CEO王文宇受邀参与2023数博会圆桌对话 畅谈LLM数据安全问题

新闻
1年前

“数据要素和LLM让数据运营安全成为必然,数据要素的多态性、易复制性等特点让其显著区别于其他生产要素,大模型的广泛依赖数据输入的特点也给数据安全带来了巨大的挑战,这让传统的数据防护思路变成了马奇诺防线,从数据本体出发,基于数据安全左移构建数据运营安全体系成为未来数据安全建设的必然。”


5月26日上午,2023中国国际大数据产业博览会正式在贵阳开幕,作为本届数博会的核心论坛之一的“数据安全产业高质量发展”高端对话成功举办,本次对话以“提高数据安全保障能力,推动安全产业高质量发展”为主题。受主办方邀请,数安行创始人、CEO王文宇携手其他三位嘉宾同台献智,共同探索数据安全发展之路。



LLM大模型面临多种安全困境亟需建立数据安全系统


ChatGPT作为人工智能领域的一个新突破, 打破了以往以人工设置学习目标为导向的学习模式,在人工智能技术上实现了重大飞跃,引发了新一轮科技发展浪潮,成为了最热门的话题之一,但其瞬间爆红的背后,数据安全问题也引起了社会关切。


针对以上问题,王文宇指出,ChatGPT带来生产方式和生产力的巨大变革的可能,任何事务都是双面的,这段时间,意大利等欧洲国家对其的控制使用,三星使用ChatGPT产生的泄密事件等,都是现实中面临的问题。一方面,LLM大模型的使用面临数据道德遵从和合规的问题,LLM大模型既要合乎法律法规,也要符合道理伦理,公序良俗。另一方面,对于政府企事业单位使用过程中涉及的核心数据、重要数据、个人信息等敏感数据泄露问题也尤为突出。


王文宇结合目前面临的数据安全挑战,将安全解决方案分为三个维度:


一是政府的约束和监管,这一点OpenAI的CEO Altman已经在美国提出了类似的请求;


二是LLM大模型涉及过程中对数据的有效过滤,尽量减少数据污染和投毒的概率;


三是企业在使用LLM大模型时,应该平行构建针对大模型的数据安全系统,一方面解决符合法律法规和道德遵从问题,另一方面解决敏感数据外泄问题。


据王文宇介绍,基于以上三种维度,目前数安行的数据运营安全平台可以提供有效支撑。数安行在国内首次提出了‍‍ DataSecOps(数据运营安全)安全理念,理念基于数据在业务侧流转,内外部基于数据场景建立全流程的防护机制,打造了跨存储、应用及终端的合规防护一体化安全架构,其产品(数安行零信任数据运营安全平台)应用可建立数据全链路数据发现、跟踪、监测、管控,以及全面的自动化安全评估能力。


数据运营安全是数据要素治理的重要组成部分


去年,“数据二十条”重磅出台,多次提及“安全”“治理”“数据要素”等关键字,更是指出要“建立安全可控、弹性包容的数据要素治理制度”。建立安全可控、弹性包容的数据要素治理,需要充分理解业务场景与数据风险,采用自动化、智能化的数据安全策略,在充分保障数据要素流通的基础上,促进数据快速流转及安全协作共享,防范内部敏感数据违规滥用风险。


王文宇认为,数据只有被开发利用才有价值,一定程度上如同土地,但数据的多态性,易复制性等特性,又形成了不同于土地市场的独特生态,对于政府监管侧,数据提供方,数据使用方,各有不同的诉求,如何将这些诉求统一在一个平面,一个平台,是一个巨大的调整,同时也是行业从业者的机遇。数据运营安全会是一个重要的方面之一,在数据运营过程中内嵌数据安全的属性,或许未来是一个必选的方式之一


中小企业在数据安全建设方面需要平衡业务和安全之间的关系


在数实融合的大环境下,针对中小企业如何应对数据安全挑战的问题,王文宇认为中小企业在数实融合中面临着非常显性的数据安全的挑战,这种挑战不止于数据安全方面的合法合规方面,而自身业务的数字化转型带来的数据安全风险的扩大给中小企业经营者带来了巨大的现实压力。同时,考虑到中小企业的现实情况,ROI投资回报率也是考虑的重要出发点,基于这些因素,中小企业在数据安全建设方面适合建设更重视实效的,更加有业务弹性的,集成电路板类似的数据安全平台,以平衡业务和安全之间的关系。


此外,王文宇认为,数据安全产业方兴未艾,在很多方面都在探索期和试验期,包括数字化转型给企事业单位内部业务运营带来的改变和挑战,数据共享和交易所带来的全新的生态中数据安全问题,OpenAI为代表的LLM给未来生产力和生产关系带来的新课题,都需要数据安全行业同仁,群策群力,形成有效的政产学研用的良性互动和循环,不断形成和打磨数据安全产品和方案,让数据安全的创造价值。