亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

在python中將Timex字符串轉換為日期時間

在python中將Timex字符串轉換為日期時間

慕絲7291255 2021-11-30 16:37:37
我想將 Timex 日期格式字符串列表(來自 SUTime)轉換為正常的日期時間格式。問題是,我有許多不同的類型:dates = ['2018-07-09',          '2018-W15',          '2018-02',          '2018-04-06',         '2018-W15',         '2018-02',         '2015-09',         '2018-09-27 INTERSECT P5D',         'FUTURE_REF',         'FUTURE_REF',         'PXY',         'THIS P1D INTERSECT 2018-09-28',         {'end': 'XXXX-06', 'begin': 'XXXX-04'},          '2014-03-19',         '2018-08-02']我有兩個目標:忽略所有不直接指示特定日期的條目將所有其他轉換為'yyyy-mm-dd'格式,始終引用年、月、周等的第一天。例如:'2018-02'應該變成'2018-02-01'或'2018-W15' 2018-04-09我嘗試使用熊貓的pd.to_datetime功能,但這不會將周轉換為日期
查看完整描述

1 回答

?
肥皂起泡泡

TA貢獻1829條經驗 獲得超6個贊

當數據收集不統一時,這有點挑戰。我不熟悉 Timex,無法找到任何可能有幫助的軟件包。


這可能會幫助你。我編寫了一些處理每個特定情況的函數。


import datetime

from pprint import pprint


dates = ['2018-07-09',

         '2018-W15',

         '2018-02',

         '2018-04-06',

         '2018-W15',

         '2018-02',

         '2015-09',

         '2018-09-27 INTERSECT P5D',

         'FUTURE_REF',

         'FUTURE_REF',

         'PXY',

         'THIS P1D INTERSECT 2018-09-28',

         {'end': 'XXXX-06', 'begin': 'XXXX-04'},

         '2014-03-19',

         '2018-08-02']


FORMAT = '%Y-%m-%d'

def get_simple_date(item, strformat=FORMAT):

    try:

        return (True, datetime.datetime.strptime(item, strformat))

    except (ValueError, TypeError):

        return (False, item)


def get_from_split(is_resolved, item):

    if is_resolved:

        return (is_resolved, item)

    try:

        tokens = item.split(' ')

        are_resolved, items = zip(*(get_simple_date(token) for token in tokens))

        if any(are_resolved):

            # assume one valid token

            result, = (item for item in items if isinstance(item, datetime.datetime))

            return (True, result)

    except (ValueError, AttributeError):

        pass

    return (False, item)


def get_from_no_day(is_resolved, item):

    if is_resolved:

        return (is_resolved, item)

    if not 'W' in item:

        try:

            return (True, datetime.datetime.strptime(f'{item}-01', FORMAT))

        except ValueError:

            pass

    return (False, item)


def get_from_w_date(is_resolved, item):

    if is_resolved:

        return (is_resolved, item)

    if 'W' in item:

        return (True, datetime.datetime.strptime(f'{item}-1', "%Y-W%W-%w"))

    return (is_resolved, item)


collection1 = (get_simple_date(item) for item in dates)

collection2 = (get_from_split(*args) for args in collection1)

collection3 = (get_from_no_day(*args) for args in collection2)

collection4 = (get_from_w_date(*args) for args in collection3)

pprint([d for is_resolved, d in collection4 if is_resolved], indent=4)

輸出:


[   datetime.datetime(2018, 7, 9, 0, 0),

    datetime.datetime(2018, 4, 9, 0, 0),

    datetime.datetime(2018, 2, 1, 0, 0),

    datetime.datetime(2018, 4, 6, 0, 0),

    datetime.datetime(2018, 4, 9, 0, 0),

    datetime.datetime(2018, 2, 1, 0, 0),

    datetime.datetime(2015, 9, 1, 0, 0),

    datetime.datetime(2018, 9, 27, 0, 0),

    datetime.datetime(2018, 9, 28, 0, 0),

    datetime.datetime(2014, 3, 19, 0, 0),

    datetime.datetime(2018, 8, 2, 0, 0)]


查看完整回答
反對 回復 2021-11-30
  • 1 回答
  • 0 關注
  • 184 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號