我有一個鑲木地板文件,其中包含許多類型的列converted_type (legacy): TIMESTAMP_MICROS。我想檢查該標志isAjustedToUTC是否正確。我可以這樣得到:import pyarrow.parquet as pqimport re arrow = pq.ParquetFile("/Parquet/File/Path/filename.parquet")timestamp_string = str(arrow.metadata.row_group(0).column(79).statistics.logical_type)re.search("isAdjustedToUTC=(.*), timeUnit",timestamp_string).group(1)這給了我trueorfalse作為字符串。isAdjustedToUTC是否有另一種方法可以在不使用正則表達式的情況下檢索 的值?
1 回答

叮當貓咪
TA貢獻1776條經驗 獲得超12個贊
據我所知這是不可能的。屬于不直接公開其底層成員的logical_type類型。pyarrow._parquet.ParquetLogicalType
唯一可用的字段是:
dir(logical_type)
>> ['__class__',
'__delattr__',
'__dir__',
'__doc__',
'__eq__',
'__format__',
'__ge__',
'__getattribute__',
'__gt__',
'__hash__',
'__init__',
'__init_subclass__',
'__le__',
'__lt__',
'__ne__',
'__new__',
'__pyx_vtable__',
'__reduce__',
'__reduce_ex__',
'__repr__',
'__setattr__',
'__setstate__',
'__sizeof__',
'__str__',
'__subclasshook__',
'to_json',
'type']
您可以使用該to_json功能,但它與您建議的選項一樣臟:
import json
json.loads(logical_type.to_json())['isAdjustedToUTC']
>> true
- 1 回答
- 0 關注
- 174 瀏覽
添加回答
舉報
0/150
提交
取消