首頁猿問 Plotly：如何創建具有多顏色標...

Plotly：如何創建具有多顏色標簽的時間序列變量的線圖？

Python

繁花如伊 2023-09-26 14:17:35

我有一個作為 df 的數據幀，它有一列我在 y 下作為“參數”傳遞，如下所示，并將其根據變量“時間”繪制。該變量在“標簽”列下有 2 個標簽，該標簽在顏色下傳遞。import plotly.express as px fig= px.line(data_frame= df, x='time', y='parameter', color='labels')請找到我為圖表附加的圖像。兩張圖片都具有相同的變量，但第二張圖片是第一張圖片的縮放版本，以便更好地了解。正如你所看到的，我正在繪制一個變量與時間的關系，并期望兩個標簽有不同的顏色，plotly在圖表中給出了兩條單獨的線，顏色為藍色和紅色，看起來非常混亂和錯誤。我應該進行哪些更改才能獲得 2 種不同顏色的連續圖表？更多解釋：我不希望藍線穿過紅色圖（請參閱附圖），反之亦然，因為我只繪制一張圖。我想要如圖第三張圖所示的圖表。先感謝您。

查看完整描述

2 回答

眼眸繁星

TA貢獻1873條經驗獲得超9個贊

第二個建議

（請進一步閱讀我的第一個建議，了解一些假設和條件）

我已經成功地建立了一種方法，它幾乎應該涵蓋您在這里所要求的所有內容。提供真正挑戰的唯一細節是如何可視化跡線之間的間隙，因為我的第二個建議建立在為每個單獨的跡線添加唯一跡線的基礎上label。您可能懷疑這可能會用一堆重復的名稱填充圖例，但這是通過按關聯標簽對跟蹤名稱進行分組來解決的。我還建立了一個字典，您可以在其中指定每個標簽的顏色。這是結果：

圖 2.1 - 由標簽定義的顏色

注意到灰色線了嗎？這就是我之前描述的“連接性”問題的結果。您可以通過設置中的不透明度參數（最后一個數字）來選擇隱藏或顯示該行color='rgba(200,200,200,0.2)'。您將在下面找到一個完整的代碼片段來重現該圖。有很多事情需要對整個事情進行調整，所以如果有任何不清楚的地方，請隨時詢問細節。

完整代碼：

# imports

import plotly.express as px

import plotly.graph_objects as go

import pandas as pd

import numpy as np

import random

# settings

observations = 100

np.random.seed(5)

value = np.random.uniform(low=-1, high=1, size=observations).tolist()

time = [t for t in pd.date_range('2020', freq='D', periods=observations)]#.format()]

df=pd.DataFrame({'time': time,

'value':value})

df['value']=df['value'].cumsum()

df1 = df.copy()

df1=df1.set_index('time')

# custom function to build labels as conditions of parameter values

def classify(e):

if e > 0.75: return 'high'

if e > 0.25: return 'medium'

if e >= 0: return 'low'

# custom function to set mode = line or marker, given data length

def modes(df):

if len(df) > 1: return 'lines'

else: return 'markers'

# dictionary to specify marker or line color

# this will depend on your real world labels !!!

cols = {'high': 'green',

'medium': 'blue',

'low': 'red'}

df['label1'] = [(elem-df['value'].min())/(df['value'].max()-df['value'].min()) for elem in df['value']]

df['label'] = [classify(elem) for elem in df['label1']]

df = df.drop('label1', 1)

df['group'] = df['label'].ne(df['label'].shift()).cumsum()

df = df.groupby('group')

dfs = []

for name, data in df:

dfs.append(data)

fig = go.Figure()

# one line to connect them all

fig=go.Figure((go.Scatter(x=df1.index, y=df1['value'],

name = 'all data',

line=dict(color='rgba(200,200,200,0.7)'))))

showed = []

for frame in dfs:

if frame['label'].iloc[0] not in showed:

fig.add_trace(go.Scatter(x=frame['time'], y = frame['value'],

mode = modes(frame),

marker_color = cols[frame['label'].iloc[0]],

legendgroup=frame['label'].iloc[0],

name=frame['label'].iloc[0]))

showed.append(frame['label'].iloc[0])

else:

fig.add_trace(go.Scatter(x=frame['time'], y = frame['value'],

mode = modes(frame),

marker_color = cols[frame['label'].iloc[0]],

legendgroup=frame['label'].iloc[0],

name=frame['label'].iloc[0],

showlegend=False

))

fig.update_layout(template='plotly_dark')

fig.update_xaxes(showgrid=False)

fig.update_layout(uirevision='constant')

fig.show()

第一個建議

您應該如何執行此操作在很大程度上取決于數據集的結構。根據你的問題的聲音，我只能猜測它看起來像這樣：

time param label

0 2020-01-01 -0.556014 medium

1 2020-01-02 0.185451 high

2 2020-01-03 -0.401111 medium

3 2020-01-04 0.436111 high

4 2020-01-05 0.412933 high

5 2020-01-06 0.636421 peak

6 2020-01-07 1.168237 peak

7 2020-01-08 1.205073 peak

8 2020-01-09 0.798674 peak

9 2020-01-10 0.174116 high

param如果是這樣，那么如果您想用不同顏色的線條軌跡進行顯示，您很快就會遇到數據點之間奇怪的連接問題。我想到的第一件事是將一種顏色的線條與多種顏色的標記相結合，如下所示：

這將為您提供良好的交互性，您可以在其中打開和關閉所有元素，也許只研究數據中的以下部分label=='peak：

讓我知道這對您來說效果如何，我們可以討論更多細節。您可以在此處找到數據樣本和所有詳細信息：

完整代碼：

# imports

import plotly.express as px

import plotly.graph_objects as go

import pandas as pd

import numpy as np

import random

# settings

observations = 100

np.random.seed(5); cols = list('a')

param = np.random.uniform(low=-1, high=1, size=observations).tolist()

time = [t for t in pd.date_range('2020', freq='D', periods=observations).format()]

df=pd.DataFrame({'time': time,

'param':param})

df['param']=df['param'].cumsum()

def classify(e):

if e > 0.9: return 'peak'

if e > 0.75: return 'high'

if e > 0.25: return 'medium'

if e > 0.9: return 'low'

if e >= 0: return 'bottom'

df['label1'] = [(elem-df['param'].min())/(df['param'].max()-df['param'].min()) for elem in df['param']]

df['label'] = [classify(elem) for elem in df['label1']]

df = df.drop('label1', 1)

fig=go.Figure((go.Scatter(x=df['time'], y=df['param'],

mode='lines',

line=dict(color='rgba(0,0,200,0.7)'))))

fig.add_traces(px.scatter(df, x='time', y='param', color='label').data)

fig.update_layout(template='plotly_dark')

fig.update_xaxes(showgrid=False)

fig.show()

反對回復 2023-09-26

天涯盡頭無女友

TA貢獻1831條經驗獲得超9個贊

如果我理解正確，您正在嘗試繪制具有兩個不同顏色標簽的單個時間序列數據。在同一個圖中繪制多條線會導致一些重疊，因為它共享時間軸。

為什么不使用散點圖（不連接點）？根據數據的密度，這在視覺上看起來類似于連接的直線/曲線。

您還可以嘗試繪制藍線和紅線并進行一些垂直移動以減少重疊。

反對回復 2023-09-26

2 回答
0 關注
197 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

Plotly：如何創建具有多顏色標簽的時間序列變量的線圖？

Plotly：如何創建具有多顏色標簽的時間序列變量的線圖？

2 回答

第二個建議

圖 2.1 - 由標簽定義的顏色

完整代碼：

完整代碼：

添加回答

Plotly：如何創建具有多顏色標簽的時間序列變量的線圖？