亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

使用假設庫創建多索引 pd.DataFrame

使用假設庫創建多索引 pd.DataFrame

翻過高山走不出你 2023-09-12 18:28:05
我需要創建一個pd.DataFrame帶有多重索引的。第一個索引級別是一個簡單的范圍,從1...n. 第二級是日期時間索引。所有列都包含floats. 這是我的示例n=2。from datetime import dateimport pandas as pdfrom hypothesis import givenfrom hypothesis import strategies as stfrom hypothesis.extra.pandas import columns, data_frames, indexes@given(    df1=data_frames(        columns=columns(            ["asset1", "asset2", "asset3", "cash_asset"],            elements=st.floats(allow_nan=False, allow_infinity=False),        ),        index=indexes(            elements=st.dates(                date.fromisoformat("2000-01-01"), date.fromisoformat("2020-12-31")            ),            min_size=10,            unique=True,        ).map(sorted),    ),    df2=data_frames(        columns=columns(            ["asset1", "asset2", "asset3", "cash_asset"],            elements=st.floats(allow_nan=False, allow_infinity=False),        ),        index=indexes(            elements=st.dates(                date.fromisoformat("2000-01-01"), date.fromisoformat("2020-12-31")            ),            min_size=10,            unique=True,        ).map(sorted),    ),)def test_index_level(df1, df2):    df = pd.concat([df1, df2], keys=["df1", "df2"])    assert df.index.nlevels == 2我想知道如何使用hypothesis庫直接創建多重索引?很明顯,我無法像我的玩具示例中那樣手動定義df1、df2等。另一個限制是level 2所有出現的索引都必須相同level 1。
查看完整描述

1 回答

?
www說

TA貢獻1775條經驗 獲得超8個贊

您可以lists組合數據幀,而不是單獨定義每個數據幀。

要使每個第一個索引的第二個索引(例如日期)相同,您可以首先計算索引,然后將其提供給生成的列表。也許有一種更簡單的方法,但我使用復合材料做到了:


@composite

def df_lists(draw, elements=indexes(

    elements=st.dates(

        date.fromisoformat("2000-01-01"),

        date.fromisoformat("2020-12-31")

    ),

    min_size=10,

    unique=True,

)):

    index = draw(elements.map(sorted))

    df_list = lists(

        data_frames(

            columns=columns(

                ["asset1", "asset2", "asset3", "cash_asset"],

                elements=st.floats(allow_nan=False, allow_infinity=False),

            ),

            index=just(index),  # have to make a strategy from the drawn index values

        ),

        min_size=1, max_size=5  # assume n = 5

    )

    return draw(df_list)



@given(df_lists())

def test_index_level(df_list):

    df = pd.concat(df_list,

                   keys=["df" + str(i + 1) for i in range(len(df_list))])

    assert df.index.nlevels == 2


查看完整回答
反對 回復 2023-09-12
  • 1 回答
  • 0 關注
  • 141 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號