首頁猿問在 Pandas...

在 Pandas 中對包含數字的字符串列進行排序

Python

慕工程0101907 2023-05-23 14:50:05

我想按列排序我的表。該列是一個包含數字的字符串，例如 ASH11、ASH2、ASH1 等。問題是使用方法sort_values將執行“字符”排序，因此示例中的列將像這樣排序--> ASH1，ASH11，ASH2。我想要這樣的順序 --> AS20H1、AS20H2、AS20H11（考慮到最后一個數字）。我雖然考慮了字符串的最后一個字符，但有時只是最后一個，在其他情況下是最后兩個。反過來（從開頭獲取字符）也不起作用，因為字符串并不總是來自相同的長度（即在某些情況下名稱為 ASH1、ASGH22、ASHGT3 等）

查看完整描述

3 回答

湖上湖

TA貢獻2003條經驗獲得超2個贊

使用key參數（新增1.1.0）

df.sort_values(by=['xxx'], key=lambda col: col.map(lambda x: int(re.split('(\d+)',x)[-2])))

反對回復 2023-05-23

慕容森

TA貢獻1853條經驗獲得超18個贊

使用列表理解和正則表達式：

>>> import pandas as pd

>>> import re #Regular expression

>>> a = pd.DataFrame({'label':['AS20H1','AS20H2','AS20H11','ASH1','ASGH22','ASHGT3']})

>>> a

label

0 AS20H1

1 AS20H2

2 AS20H11

3 ASH1

4 ASGH22

5 ASHGT3

r'(\d+)(?!.*\d)' 匹配字符串中的最后一個數字

>>> a['sort_int'] = [ int(re.search(r'(\d+)(?!.*\d)',i).group(0)) for i in a['label']]

>>> a

label sort_int

0 AS20H1 1

1 AS20H2 2

2 AS20H11 11

3 ASH1 1

4 ASGH22 22

5 ASHGT3 3

>>> a.sort_values(by='sort_int',ascending=True)

label sort_int

0 AS20H1 1

3 ASH1 1

1 AS20H2 2

5 ASHGT3 3

2 AS20H11 11

4 ASGH22 22

反對回復 2023-05-23

慕慕森

TA貢獻1856條經驗獲得超17個贊

您可以從列中提取整數，然后使用它對數據幀進行排序

  df["new_index"] = df.yourColumn.str.extract('(\d+)')
  df.sort_values(by=["new_index"], inplace=True)

如果您在“new_index”列中得到一些 NA，您可以在 sort_values 方法中使用選項 na_position 來選擇放置它們的位置（開始或結束）

反對回復 2023-05-23

3 回答
0 關注
311 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

在 Pandas 中對包含數字的字符串列進行排序

在 Pandas 中對包含數字的字符串列進行排序

3 回答

添加回答