话说数据科学
在学习数据科学时,我们会涉及到大量的数学运算,随之而来的便是一系列的数学概念和技能,本期我们来聊聊集合的概念。
01集合(set)是什么?
先来看两个例子:
A={1,2,3,-7}
B={apple,monkey,Tom}
通过以上两个例子,我们基本上可推断出集合的概念:由一组事物组成的集合。
正式的说法:一个集合是由元素组成的,可以是一个元素,也可以是多个元素。集合A有四个元素分别为1,2,3,-7;集合B有三个元素,分别为apple,monkey,Tom。
对于元素本身,并没有严格的要求,可以是任何事物;这些元素用“{ }”包含。
若某个元素属于某个集合,通常用符号“∈”来连接。例如:
:元素2属于集合A。
若某个元素不属于某个集合,通常用符号“”俩连接。例如:
:元素8不属于集合A。
02集合的大小——基数(cardinality)
基数的含义,是指某个集合中所包含元素的个数。通常用符号“| |”来表示某个集合的基数。例如:
集合A一共有4个元素,则|A|=4。
集合B一共有3个元素,则|B|=3。
03交集(intersections)与并集(unions)
关于交集与并集的概念,我们通过以下三个例子来进行说明:
A={0,2,3,-7}
B={2,8,3,9}
C={4,9}
交集通常用符号“∩”来连接,例如:
,:集合A和集合B的交集为{2,3}。
:集合B和集合C的交集为{9}。
因此,交集是指两个集合中所共有的元素组合的集合。一般的写法为:
如果用一个更为通俗易懂的事件来进行说明的话,可以这样来表示:
把交集比作一个俱乐部,一个人想要进入该俱乐部,若确认这个人既有A集合的身份,又有B集合的身份,则可以进入交集俱乐部;若此人仅有A集合的身份,没有B集合的身份,则不准许进入俱乐部。

并集通常用符号“∪”来连接,例如:
因此,并集是指两个集合中所有非重复元素组合的集合。一般写作:

以上即是关于集合的基本概念以及与之相关的一些其他概念。关注我,带你了解更多数据科学的基础知识。
#百度知识狂欢节##百度付费专栏# #百度知识英雄大会#
举报/反馈