首頁猿問 python：CSV文件中的列表元素

python：CSV文件中的列表元素

Python

慕娘9325324 2022-07-12 14:50:17

我有一個csv這樣結構的文件：Id,Country,Cities1,Canada,"['Toronto','Ottawa','Montreal']"2,Italy,"['Rome','Milan','Naples', 'Palermo']"3,France,"['Paris','Cannes','Lyon']"4,Spain,"['Seville','Alicante','Barcelona']"最后一列包含一個列表，但它被表示為一個字符串，因此它被視為單個元素。解析文件時，我需要將此元素作為一個list，而不是一個字符串。到目前為止，我已經找到了轉換它的方法：L = "['Toronto','Ottawa','Montreal']"seq = ast.literal_eval(L)由于我是的新手python，我的問題是 - 這是這樣做的正常方式，還是有一種正確的方式來表示 CSV 中的列表，這樣我就不必進行轉換，或者有更簡單的轉換方式？謝謝！

查看完整描述

3 回答

烙印99

TA貢獻1829條經驗獲得超13個贊

使用ast.literal_eval(...)會起作用，但它需要其他 CSV 讀取軟件無法識別的特殊語法，并使用一個eval危險信號。

使用 eval 可能很危險，即使在這種情況下您使用的literal_eval是比原始eval函數更受限制的更安全的選項。

通常，您會在單列中有多個值的 CSV 文件中看到它們將使用簡單的分隔符并引用該字段。

例如：

ID,Country,Cities

1,Canada,"Toronto;Ottawa;Montreal"

然后在 python 或任何其他語言中，無需求助于閱讀就變得微不足道eval：

import csv

with open("data.csv") as fobj:

reader = csv.reader(fobj)

field_names = next(reader)

rows = []

for row in reader:

row[-1] = row[-1].split(";")

rows.append(row)

問題ast.literal_eval

盡管該ast.literal_eval功能比在用戶輸入上使用常規功能要安全得多eval，但它仍然可能是可利用的。的文檔literal_eval有這個警告：

警告：由于 Python 的 AST 編譯器中的堆棧深度限制，使用足夠大/復雜的字符串可能會使 Python 解釋器崩潰。

可以在這里找到一個演示：

>>> import ast

>>> ast.literal_eval("()" * 10 ** 6)

[1] 48513 segmentation fault python

我絕對不是專家，但讓用戶能夠使程序崩潰并可能利用一些模糊的內存漏洞是不好的，在這種用例中可以避免。

如果您要使用的原因literal_eval是為了獲得正確的輸入，并且您肯定輸入數據是 100% 受信任的，那么我想它可以使用。但是，您始終可以包裝該函數以執行一些健全性檢查：

def sanely_eval(value: str, max_size: int = 100_000) -> object:

if len(value) > max_size:

raise ValueError(f"len(value) is greater than the max_size={max_size!r}")

return ast.literal_eval(value)

但是，根據您創建和使用 CSV 文件的方式，這可能會降低數據的可移植性，因為它是一種特定于 python 的格式。

反對回復 2022-07-12

DIEA

TA貢獻1820條經驗獲得超3個贊

如果您可以控制 CSV，則可以將項目與其他一些不會出現在城市中且不是逗號的已知字符分開。說冒號 ( :)。

例如，第一行將如下所示：

1,Canada,Toronto:Ottawa:Montreal

在處理數據時，您將擁有整個元素，您可以這樣做

cities.split(':')

如果你想走另一條路（你有一個 Python 列表中的城市，并且你想創建這個字符串）你可以使用join()

':'.join(['Toronto', 'Ottawa', 'Montreal'])

反對回復 2022-07-12

慕哥6287543

TA貢獻1831條經驗獲得超10個贊

對于 csv 的特定結構，您可以將城市轉換為這樣的列表：

cities = '''"['Rome','Milan','Naples', 'Palermo']"'''

cities = cities[2:-2] # remove "[ and ]"

print(cities) # 'Rome','Milan','Naples', 'Palermo'

cities = cities.split(',') # convert to list

print(cities) # ["'Rome'", "'Milan'", "'Naples'", " 'Palermo'"]

cities = [x.strip() for x in cities] # remove leading or following spaces (if exists)

print(cities) # ["'Rome'", "'Milan'", "'Naples'", "'Palermo'"]

cities = [x[1:-1] for x in cities] # remove quotes '' from each city

print(cities) # ['Rome', 'Milan', 'Naples', 'Palermo']

反對回復 2022-07-12

3 回答
0 關注
199 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

python：CSV文件中的列表元素

python：CSV文件中的列表元素

3 回答

添加回答