點(diǎn)擊下載
本文文檔

當(dāng)前位置：首頁 - 科技 - 知識百科 - 正文

分享python數(shù)據(jù)統(tǒng)計的一些小技巧

來源：懂視網(wǎng) 責(zé)編：小采時間：2020-11-27 14:28:56

分享python數(shù)據(jù)統(tǒng)計的一些小技巧

分享python數(shù)據(jù)統(tǒng)計的一些小技巧:最近在用python做數(shù)據(jù)統(tǒng)計，這里總結(jié)了一些最近使用時查找和總結(jié)的一些小技巧，希望能幫助在做這方面時的一些童鞋。有些技巧是很平常的用法，平時我們沒有注意，但是在特定場景，這些小方法還是能帶來很大的幫助。 1.在字典中將鍵映射到多個值上面 {'b

推薦度：

點(diǎn)擊下載本文 文檔為doc格式

導(dǎo)讀分享python數(shù)據(jù)統(tǒng)計的一些小技巧:最近在用python做數(shù)據(jù)統(tǒng)計，這里總結(jié)了一些最近使用時查找和總結(jié)的一些小技巧，希望能幫助在做這方面時的一些童鞋。有些技巧是很平常的用法，平時我們沒有注意，但是在特定場景，這些小方法還是能帶來很大的幫助。 1.在字典中將鍵映射到多個值上面 {'b

最近在用python做數(shù)據(jù)統(tǒng)計，這里總結(jié)了一些最近使用時查找和總結(jié)的一些小技巧，希望能幫助在做這方面時的一些童鞋。有些技巧是很平常的用法，平時我們沒有注意，但是在特定場景，這些小方法還是能帶來很大的幫助。

1.在字典中將鍵映射到多個值上面

{'b': [4, 5, 6], 
'a': [1, 2, 3]}

有時候我們在統(tǒng)計相同key值的時候，希望把所有相同key的條目添加到以key為鍵的一個字典中，然后再進(jìn)行各種操作，這時候我們就可以使用下面的代碼進(jìn)行操作：

from collections import defaultdict
d = defaultdict(list)
print(d)
d['a'].append(1)
d['a'].append(2)
d['a'].append(3)
d['b'].append(4)
d['b'].append(5)
d['b'].append(6)
print(d)
print(d.get("a"))
print(d.keys())
print([d.get(i) for i in d])

這里是使用了collections中的方法，這里面還擁有很多有用的方法，我們有時間在繼續(xù)進(jìn)行深入了解。

上面代碼運(yùn)行結(jié)果：

defaultdict(, {})
defaultdict(, {'b': [4, 5, 6], 'a': [1, 2, 3]})
[1, 2, 3]
dict_keys(['b', 'a'])
[[4, 5, 6], [1, 2, 3]]

我們將數(shù)據(jù)填入之后，相當(dāng)于進(jìn)行快速分組，然后遍歷每個組就可以統(tǒng)計一些我們需要的數(shù)據(jù)。

2.迅速轉(zhuǎn)換字典鍵值對

data = {...}
zip(data.values(), data.keys())

data是我們的格式數(shù)據(jù)，使用zip后進(jìn)行快速鍵值轉(zhuǎn)換，然后可以使用max，min之類函數(shù)進(jìn)行數(shù)據(jù)操作。

3.通過公共鍵對字典進(jìn)行排序

from operator import itemgetter
data = [
 {'name': "bran", "uid": 101},
 {'name': "xisi", "uid": 102},
 {'name': "land", "uid": 103}
]
print(sorted(data, key=itemgetter("name")))
print(sorted(data, key=itemgetter("uid")))

數(shù)據(jù)格式就是data，我們想要對name或者uid進(jìn)行排序我們就是用代碼中的方法。
運(yùn)行結(jié)果：

[{'name': 'bran', 'uid': 101}, {'name': 'land', 'uid': 103}, {'name': 'xisi', 'uid': 102}]
[{'name': 'bran', 'uid': 101}, {'name': 'xisi', 'uid': 102}, {'name': 'land', 'uid': 103}]

正如我們期望中的一樣

4.對列表中的多個字典根據(jù)某一字段進(jìn)行分組

注意注意，在進(jìn)行分組前要首先對數(shù)據(jù)進(jìn)行排序處理，排序字段根據(jù)實(shí)際要求來選擇

即將處理的數(shù)據(jù)：

rows = [
 {'name': "bran", "uid": 101, "class": 13},
 {'name': "xisi", "uid": 101, "class": 11},
 {'name': "land", "uid": 103, "class": 10}
]

期望處理結(jié)果：

{
101: [{'name': 'xisi', 'class': 11, 'uid': 101},{'name': 'bran', 'class': 13, 'uid': 101}],
103: [{'name': 'land', 'class': 10, 'uid': 103}]
}

我們按照uid進(jìn)行分組，這里只是演示，uid一般也不會重復(fù)。

這個比較復(fù)雜一點(diǎn)，我們一部一步來分解

some = [('a', [1, 2, 3]), ('b', [4, 5, 6])]
print(dict(some))

結(jié)果：

{'b': [4, 5, 6], 'a': [1, 2, 3]}

這里我們的目的是將元組轉(zhuǎn)換成字典，這個很簡單，應(yīng)該都能看懂。接著我們來下一步對待處理數(shù)據(jù)進(jìn)行排序：

data_one = sorted(rows, key=itemgetter("class"))
print(data_one)
data_two = sorted(rows, key=lambda x: (x["uid"], x["class"]))
print(data_two)

這里我們提供兩種排序方式原理相同，只是樣式稍有區(qū)別，第一種data_one是直接使用itemgetter，按照我們前面使用過得，直接按照某一字段進(jìn)行排序，可是有時候我們會有另一種要求：

先按照某一字段排序，當(dāng)?shù)谝蛔侄沃貜?fù)時，再按照另一字段排序。

這時我們就用第二種方法，進(jìn)行多字段值排序。
排序結(jié)果如下：

[{'name': 'land', 'class': 10, 'uid': 103}, {'name': 'xisi', 'class': 11, 'uid': 101}, {'name': 'bran', 'class': 13, 'uid': 101}]
[{'name': 'xisi', 'class': 11, 'uid': 101}, {'name': 'bran', 'class': 13, 'uid': 101}, {'name': 'land', 'class': 10, 'uid': 103}]

結(jié)果大家慢慢看一下，還是略有差別。

接下來就進(jìn)行最后一步了，將我們剛才講的兩種方式結(jié)合起來使用：

data = dict([(g, list(k)) for g, k in groupby(data_two, key=lambda x: x["uid"])])
print(data)

我們對排序好的數(shù)據(jù)進(jìn)行分組，然后生成元組列表，最后將其轉(zhuǎn)換成字典，這里大功告成，我們成功將數(shù)據(jù)進(jìn)行分組。

python數(shù)據(jù)統(tǒng)計的一些小技巧就分享到這，有需要的可以參考學(xué)習(xí)。

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

分享python數(shù)據(jù)統(tǒng)計的一些小技巧

推薦度：

點(diǎn)擊下載本文 文檔為doc格式

標(biāo)簽：分享小技巧數(shù)據(jù)

熱門焦點(diǎn)

国产99久久精品_欧美日本韩国一区二区_激情小说综合网_欧美一级二级视频_午夜av电影_日本久久精品视频

分享python數(shù)據(jù)統(tǒng)計的一些小技巧

分享python數(shù)據(jù)統(tǒng)計的一些小技巧

分享python數(shù)據(jù)統(tǒng)計的一些小技巧

最新推薦

猜你喜歡

熱門推薦