话说数据科学

  在学习数据科学时,我们会涉及到大量的数学运算,随之而来的便是一系列的数学概念和技能,本期我们来聊聊集合的概念。

  01集合(set)是什么?

  先来看两个例子:

  A={1,2,3,-7}

  B={apple,monkey,Tom}

  通过以上两个例子,我们基本上可推断出集合的概念:由一组事物组成的集合。

  正式的说法:一个集合是由元素组成的,可以是一个元素,也可以是多个元素。集合A有四个元素分别为1,2,3,-7;集合B有三个元素,分别为apple,monkey,Tom。

  对于元素本身,并没有严格的要求,可以是任何事物;这些元素用“{ }”包含。

  若某个元素属于某个集合,通常用符号“∈”来连接。例如:

  :元素2属于集合A。

  若某个元素不属于某个集合,通常用符号“”俩连接。例如:

  :元素8不属于集合A。

  02集合的大小——基数(cardinality)

  基数的含义,是指某个集合中所包含元素的个数。通常用符号“| |”来表示某个集合的基数。例如:

  集合A一共有4个元素,则|A|=4。

  集合B一共有3个元素,则|B|=3。

  03交集(intersections)与并集(unions)

  关于交集与并集的概念,我们通过以下三个例子来进行说明:

  A={0,2,3,-7}

  B={2,8,3,9}

  C={4,9}

  交集通常用符号“∩”来连接,例如:

  ,:集合A和集合B的交集为{2,3}。

  :集合B和集合C的交集为{9}。

  因此,交集是指两个集合中所共有的元素组合的集合。一般的写法为:

  如果用一个更为通俗易懂的事件来进行说明的话,可以这样来表示:

  把交集比作一个俱乐部,一个人想要进入该俱乐部,若确认这个人既有A集合的身份,又有B集合的身份,则可以进入交集俱乐部;若此人仅有A集合的身份,没有B集合的身份,则不准许进入俱乐部。

  

  并集通常用符号“∪”来连接,例如:

  因此,并集是指两个集合中所有非重复元素组合的集合。一般写作:

  

  以上即是关于集合的基本概念以及与之相关的一些其他概念。关注我,带你了解更多数据科学的基础知识。

  #百度知识狂欢节##百度付费专栏# #百度知识英雄大会#

  举报/反馈