陈国青:从隐私权、商业伦理、道德、法律等层面思考如何合理使用大数据

  陈国青教授介绍,大数据时代可以分为两个阶段。第一个阶段是数据商务阶段。第二个阶段是算法商务阶段。其中,大数据的数据特征可以从 4 个维度来理解,即 4V:volume(容量)、variety(种类)、velocity(速度)、value(价值)。 第一,大数据意味着超规模(Volume)。大数据的规模从一般意义上讲具有大规模、海量的含义,但是没有绝对的量纲标准,而是和领域及其问题相关。超规模是指超出了原有领域和问题规模边界的大规模。第二,大数据意味着多样性(Variety)。富媒体(Rich Media)大大扩展了人们的数字化生活体验,全球数据和数字流量中 80%-90%都是文本、视频、语音、图像。 第三,我们处在数据的海洋之中,但与我们企业或个人相关的数据相对说来是很少的,所以是低价值密度的(Value)。如何从低价值密度的数据海洋中挖掘出有用信息,成为企业数据分析的关键。 第四,大数据的实时性强(Velocity)。数据就像开着的水龙头一样,源源不断地出来。

  大数据冲击各行各业

  陈国青教授介绍:大数据开始在改变会计学。传统的会计学强调三张报表:资产负债表、现金流量表和利润表,但对于长周期、高负债、高不确定性的 IT 企业、新行业企业、创业企业等,它们的客户忠诚度、口碑、品牌等无形资产的价值可能挺高,因此,会计业界和学界提出“第四张报表”来反映相关的数据资产。

  历史学上大数据也改变了传统的“自上而下的”史学观,在大数据时代,历史的记录可以自下而上。比如国家图书馆互联网信息战略保存项目,与新浪微博合作,保存新浪微博公开博文,所有微博用户都成为了历史的记录者,通过自上而下与自下而上的融合,为后代研究当代历史提供了更细粒度的单位和更加广阔的全局视野 。

  陈国青教授特别提到,当个人数据被大量搜集和记录,被遗忘的权利也变得重要起来。所谓被遗忘权是指数据主体有权要求数据控制者永久删除有关数据主体的个人数据,有权被互联网遗忘,除非数据的保留有合法的理由。这体现了大数据对法学界的影响。

  此外大数据对股价预测、体育、哲学、农业、医学、文学等领域也产生了深刻影响。

  

  感测和响应大数据时代

  人工智能是大数据时代的一类技术,目前的成果是数十年以来研究成果的工程化和产品化。 当前人工智能面临的一个重要挑战是“黑盒子”问题,这也激发了学界和业界对于“可解释人工智能”的攻关。

  同时人工智能的出现,催生了机器人,进而也催生了新的学科:机器行为学,研究机器如何塑造人的行为、人类如何塑造机器的行为以及人机协作的行为。

  陈国青教授特别强调,目前隐私泄露、大数据杀熟、App 权限滥用等现象,也促使人们从隐私权、商业伦理、道德、法律等层面思考如何合理地使用大数据。

  “人文清华”讲坛是清华大学发起的大型思想传播活动,推动建设更创新、更国际、更人文的清华新百年。讲坛定期邀请优秀人文学者,在标志性建筑新清华学堂发表公众演讲,阐述其经典学说、独特思考和重大发现。讲坛于 2016 年 1 月 10 日在新清华学堂正式开启以来,已举办 21 场演讲。(人民日报中央厨房·半亩方塘工作室 陈国占)