3 回答

TA貢獻1829條經驗 獲得超13個贊
使用ast.literal_eval(...)會起作用,但它需要其他 CSV 讀取軟件無法識別的特殊語法,并使用一個eval危險信號。
使用 eval 可能很危險,即使在這種情況下您使用的literal_eval是比原始eval函數更受限制的更安全的選項。
通常,您會在單列中有多個值的 CSV 文件中看到它們將使用簡單的分隔符并引用該字段。
例如:
ID,Country,Cities
1,Canada,"Toronto;Ottawa;Montreal"
然后在 python 或任何其他語言中,無需求助于閱讀就變得微不足道eval:
import csv
with open("data.csv") as fobj:
reader = csv.reader(fobj)
field_names = next(reader)
rows = []
for row in reader:
row[-1] = row[-1].split(";")
rows.append(row)
問題ast.literal_eval
盡管該ast.literal_eval功能比在用戶輸入上使用常規功能要安全得多eval,但它仍然可能是可利用的。的文檔literal_eval有這個警告:
警告:由于 Python 的 AST 編譯器中的堆棧深度限制,使用足夠大/復雜的字符串可能會使 Python 解釋器崩潰。
可以在這里找到一個演示:
>>> import ast
>>> ast.literal_eval("()" * 10 ** 6)
[1] 48513 segmentation fault python
我絕對不是專家,但讓用戶能夠使程序崩潰并可能利用一些模糊的內存漏洞是不好的,在這種用例中可以避免。
如果您要使用的原因literal_eval是為了獲得正確的輸入,并且您肯定輸入數據是 100% 受信任的,那么我想它可以使用。但是,您始終可以包裝該函數以執行一些健全性檢查:
def sanely_eval(value: str, max_size: int = 100_000) -> object:
if len(value) > max_size:
raise ValueError(f"len(value) is greater than the max_size={max_size!r}")
return ast.literal_eval(value)
但是,根據您創建和使用 CSV 文件的方式,這可能會降低數據的可移植性,因為它是一種特定于 python 的格式。

TA貢獻1820條經驗 獲得超3個贊
如果您可以控制 CSV,則可以將項目與其他一些不會出現在城市中且不是逗號的已知字符分開。說冒號 ( :
)。
例如,第一行將如下所示:
1,Canada,Toronto:Ottawa:Montreal
在處理數據時,您將擁有整個元素,您可以這樣做
cities.split(':')
如果你想走另一條路(你有一個 Python 列表中的城市,并且你想創建這個字符串)你可以使用join()
':'.join(['Toronto', 'Ottawa', 'Montreal'])

TA貢獻1831條經驗 獲得超10個贊
對于 csv 的特定結構,您可以將城市轉換為這樣的列表:
cities = '''"['Rome','Milan','Naples', 'Palermo']"'''
cities = cities[2:-2] # remove "[ and ]"
print(cities) # 'Rome','Milan','Naples', 'Palermo'
cities = cities.split(',') # convert to list
print(cities) # ["'Rome'", "'Milan'", "'Naples'", " 'Palermo'"]
cities = [x.strip() for x in cities] # remove leading or following spaces (if exists)
print(cities) # ["'Rome'", "'Milan'", "'Naples'", "'Palermo'"]
cities = [x[1:-1] for x in cities] # remove quotes '' from each city
print(cities) # ['Rome', 'Milan', 'Naples', 'Palermo']
添加回答
舉報