Python - 基礎資料型別 set 集合

小菠蘿測試筆記發表於2021-07-31

集合的簡介

  • 集合是一個無序、不重複的序列
  • 它的基本用法包括成員檢測和消除重複元素
  • 集合物件也支援像 聯合,交集,差集,對稱差分等數學運算
  • 集合中所有的元素放在 {} 中間,並用逗號分開

 

集合的栗子

這裡會有個重點知識

# 宣告
basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
print(basket)

set_ = {1, 1, 1, 1, 2}
print(set_)


# 輸出結果
{'orange', 'pear', 'banana', 'apple'}
{1, 2}

自動去重了,每個元素只保留一個,且是無序的

 

再來看一個栗子

set_ = {{1, }, {1, }}
print(set_)

set_ = {[1, ], [2, ]}
print(set_)


# 輸出結果
    set_ = {{1, }, {1, }}
TypeError: unhashable type: 'set'


    set_ = {[1, ], [2, ]}
TypeError: unhashable type: 'list'

 

為什麼報錯?

重點:因為 set 集合只能包含不可變物件元素,而列表、集合本身都是可變物件,所以會報錯

 

集合和列表的區別

  • 列表中的元素允許重複,集合中的元素不允許重複
  • 列表是有序的,提供了索引操作,集合是無序的,沒有索引操作
set_ = {1, 1, 1, 1, 2}
set[1]


# 輸出結果
    set[1]
TypeError: 'type' object is not subscriptable

提示該型別不能下標

 

特殊集合

如何建立一個空集合

set_ = {}
print(set_, type(set_))

# 輸出結果 {} <class 'dict'>

不可以直接 { },這樣預設是一個空字典哦

 

正確寫法

set_ = set()
print(set_, type(set_))


# 輸出結果
set() <class 'set'>

 

常見運算操作

運算子 |

合併多個集合

>>> {1, 2} | {3, 4}
{1, 2, 3, 4}
>>> {1, 2} | {3, 4} | {5, 6}
{1, 2, 3, 4, 5, 6}

 

運算子 -

從集合中刪除元素

>>> {1, 2, 3, 4} - {3, 4, 5, 6}
{1, 2}

 

運算子 & 

取交集,返回兩個集合都包含的元素

>>> {1, 2, 3} & {3, 4, 5}
{3}

 

運算子 ^

取差集

>>> {1, 2, 3} ^ {3, 4, 5}
{1, 2, 4, 5}

 

關鍵字 in

檢查集合中是否包含指定元素

>>> 'polo' in {'www', 'polo', 'com'}
True
>>> 'yy' in {'www', 'yyy', 'com'}
False

 

常見函式

len(set) 

獲取集合的長度

>>> len({1, 2, 3})
3
>>> len({1, 2, 3, 4})
4

 

max(set) 

獲取集合中最大的元素

>>> max({1, 2})
2
>>> max({1, 3, 2})
3

 

min(set) 

獲取集合中最小的元素

>>> min({1, 2})
1
>>> min({1, 3, 2})
1

 

集合常見方法

add(item) 

向集合中新增一個元素 item

# add
set_ = {1, 2, 3}
set_.add(1)
set_.add(4)
set_.add("5")
print(set_)


# 輸出結果
{1, 2, 3, 4, '5'}

 

remove(item)

從集合中刪除指定元素 item

# remove
set_ = {1, 2, 3}
set_.remove(2)
print(set_)


# 輸出結果
{1, 3}

 

clear()

移除集合中的所有元素

# remove
set_ = {1, 2, 3}
print(set_)
set_.clear()
print(set_)


# 輸出結果
{1, 2, 3}
set()

 

pop()

移除集合首位元素,並返回該元素值

# pop
a = {1, 2, 3, 4}
print(a.pop())
print(a.pop())
print(a)


# 輸出結果
1
2
{3, 4}

 

difference()

從源集合中找出目標集合中沒有的元素集合

# difference
a = {1, 2, 3, 4}
b = {2, 3, 5}
print(a.difference(b))


# 輸出結果
{1, 4}

  

union()

返回兩個集合的並集

# union
set1 = {1, 2, 3}
set2 = {3, 4, 5}
print(set1.union(set2))


# 輸出結果
{1, 2, 3, 4, 5}

 

intersection()

返回兩個集合的交集

# intersection
set1 = {1, 2, 3}
set2 = {3, 4, 5}
print(set1.intersection(set2))


# 輸出結果
{3}

 

issubset() 

判斷指定集合是否為子集

# issubset
set1 = {1, 2}
set2 = {1, 2, 3}
print(set1.issubset(set2))


# 輸出結果
True

 

issuperset()

判斷指定集合是否為超集

# issuperset
set1 = {1, 2, 3}
set2 = {1, 2}
print(set1.issuperset(set2))


# 輸出結果
True

 

集合總結

因為集合是不可重複的,所以可以利用它來處理一些需要避免重複插入的場景,比如為了避免某一學生的資訊重複錄入

相關文章