数据科学及技术应用,对政府统计会产生什么样的影响?在第四届联合国世界数据论坛上,来自银河的教授李金昌分享了自己的观点。
什么是数据科学?
“目前没有一个统一的定义。”李教授表示,在学习当中认为数据科学就是答案,一切记录下来的事实,通过各种数据处理技术转化为有用信息的科学。这个数据科学,它是以数据为研究对象,并且把一切记录下来的事实都当做数据。这个数据就是大数据。
数据科学是一个交叉科学,涉及到计算数学、统计学、计算机科学、生物学、信息学、心理学、行为科学等等,是多学科交叉融合的。
目前来看,数据科学有四大技术领域,包括人工智能,主要是基于数据分析开展的智能化的思维;区块链技术,保证各数据块能够进行有序的链接,保证安全;云计算技术,能够快速地进行区域式的强大的数据计算并加以合成;大数据技术,对各种数据进行记录、储存和分析。
ChatGPT的应用 代表数据科学的新成果
李金昌教授认为,数据科学产生的原因主要是越来越多的数据,每天都会产生海量数据;越来越强大的数据计算能力,特别是各种算法研究;越来越安全的数据链接传输,以及越来越综合的智能化的思维。“ChatGPT的应用,就代表着数据科学目前的一个新的成果。”
在这样的情况下,数据科学技术的应用影响着人类的生产方式、就业方式、分配方式、流通方式、消费方式、生活方式、交往方式、教育方式、思维方式和科研方式。从生产到生活的各个方面,都已经受到了数据科学的技术应用的巨大影响。
“由于这些方式的巨大变化,使得政府统计的基础也发生了很大的变化。数据的产生渠道、数据的构成类型、数据的储存方式、数据的采集方式都发生了很大的变化。”李教授认为,现在数据本身也成为了生产要素,所以世界各个国家现在都高度重视数据的应用整合,并且把它们作为决策的依据。
面对数据的变化 政府统计该怎么办?
在分享中,李金昌教授提出,应该根据变化,围绕政府统计的需求,充分运用数据科学技术来重构政府统计的系统。具体来讲,应该构建至少五个方面的系统:
第一就是要构建智能化的大数据储存系统,也就是构建能够运行区块链的数据库。
第二是要构建智能化的信息采集系统。特别现在要关注这个区域化的信息系统,或者说是空间地理信息系统,包括人口、就业、产业、税收等基本的信息。
第三就是要构建智能化的综合分析评估预警系统。要分别从宏观、中观、微观的角度去构建。这对于国家治理来讲十分重要,能够及时发现经济社会发展当中可能出现的各种问题,来判断经济发展是否在应有的正常轨道上。
第四就是智能化的专题分析系统,包括CPI、资金流动、投资、消费、进出口、社会保障、人口流动变动、产业结构变化等各方面所需要的专题研究。
最后一个就是要构建智能化的数据审核系统,不断地对数据进行审核,保证数据的质量。
“总的来说,政府统计要拥抱大数据,走智能化的统计道路。”李金昌总结。