• Skip to main content
  • Skip to primary sidebar

学習記録

Plotly/Dash

CSVデータをデータフレームに入れて操作する

2018年9月10日 by 河副 太智 Leave a Comment

US CENSUSの人口データを使用して
CSVのデータをデータフレームに入れて色々操作します。

使用するCSVデータ:nst-est2017-alldata-1.csv

 

 

インポートして上5行を表示

1
2
3
4
5
6
import pandas as pd
import plotly.offline as pyo
import plotly.graph_objs as go
 
df = pd.read_csv("nst-est2017-alldata.csv")
print(df.head())

エクセルでいうフィルター

df2という名称のデータフレームに分けて
カラムがDIVISIONでありかつ値が1の物だけを入れる

1
df2 = df[df["DIVISION"] == "1"]

列の一つをインデックスに割り当て

カラムNAMEとその列の値を行に変換する

1
df2.set_index("NAME",inplace = True)

 

左側にNAMEインデックスが作成されました
※マルチインデックスにするにはdf.set_index([“a”,”b”])とする

 

 

指定文字を含むカラムを抽出

“POP”という文字で始まるカラムのみを抽出

1
2
list_of_pop_col = [col for col in df2.columns if col.startswith("POP")]
df2 = df2[list_of_pop_col]

線グラフにして出力

1
2
3
4
5
6
data = [go.Scatter(x=df2.columns,
                   y=df2.loc[name],
                   mode="lines",
                   name=name) for name in df2.index]
 
pyo.plot(data)

上記コードの詳細を以下に記載します。

x軸の指定

x=df2.columnsとなっているのはx軸に各カラムの名前を入れていく
作業になります。

 

 

y軸の指定

y=df2.loc[name]と指定しています。

[go.Scatter…]の最後にfor name in df2.indexとあるので
先程df2.set_index(“NAME”,inplace = True)にて設定した
インデックスの数だけ繰り返す形になります。

上記6種類のインデックスがあるので6回繰り返して
地名をnameに代入します。

代入されたnameの地名に該当する値をデータフレームの
左から右に読み込んでいきます。

 

グラフの種類指定

1
mode="lines"

“lines”を指定して線グラフにします。

 

各グラフの名前指定

1
name=name

for name in df2.indexでインデックスにある地名をnameに代入し、
これによって出力されたグラフに各線グラフの名称が
表示されるようになります。

 

コード

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
import pandas as pd
import plotly.offline as pyo
import plotly.graph_objs as go
df = pd.read_csv("nst-est2017-alldata.csv")
print(df.head())
 
df2 = df[df["DIVISION"] == "1"]
df2.set_index("NAME",inplace = True)
 
 
list_of_pop_col = [col for col in df2.columns if col.startswith("POP")]
df2 = df2[list_of_pop_col]
 
 
data = [go.Scatter(x=df2.columns,
                   y=df2.loc[name],
                   mode="lines",
                   name=name) for name in df2.index]
pyo.plot(data)

 

出力されたグラフ

 

曜日別にforで作成するグラフ

グラフの線を曜日別に表示する
以下の例ではわかりやすくする為df2を作成し、
forが回る度に曜日別のデータをgo.Scatterで入れていきます。

1
2
3
4
5
6
7
for day in days:
    df2 = df[df["DAY"] == day]
    trace = go.Scatter(x=df2["LST_TIME"],
                       y=df2["T_HR_AVG"],
                       mode="lines",
                       name = day)
    data.append(trace)

 

もう少しすっきりさせるには以下のようにします。

1
2
3
4
5
6
for day in days:
    trace = go.Scatter(x=df["LST_TIME"],
                       y=df[df["day"]==day]["T_HR_AVG"],
                       mode="lines",
                       name = day)
    data.append(trace)

 

高度な書き方だとforを使用せず辞書に曜日別データを入れていきます。

1
2
3
4
5
data = [{
    "x":df["LST_TIME"],
    "y":df[df["DAY"]==day]["T_HR_AVG"],
    "name":day
} for day in df["DAY"].unique()]

 

コード

使用するCSVデータ:2010YumaAZ.csv

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
import pandas as pd
import plotly.offline as pyo
import plotly.graph_objs as go
 
 
# Create a pandas DataFrame from 2010YumaAZ.csv
df = pd.read_csv("2010YumaAZ.csv")
days = ['TUESDAY','WEDNESDAY','THURSDAY','FRIDAY','SATURDAY','SUNDAY','MONDAY']
 
 
 
# Use a for loop (or list comprehension to create traces for the data list)
# data = []
 
 
for day in days:
    df2 = df[df["DAY"] == day]
    trace = go.Scatter(x=df2["LST_TIME"],
                       y=df2["T_HR_AVG"],#あるいはdf2を作らずにy=df[df["day"]==day]["T_HR_AVG"],としてもよい
                       mode="lines",
                       name = day)
    data.append(trace)
 
# Define the layout
 
layout = go.Layout(title="Daily temp avgs")
 
 
 
# Create a fig from data and layout, and plot the fig
fig = go.Figure(data=data,layout=layout)
pyo.plot(fig)

出力されたグラフ

Filed Under: Plotly/Dash

Plotly/Dashでインタラクティブグラフ作成

2018年9月6日 by 河副 太智 Leave a Comment

Plotly/Dashでインタラクティブなグラフ作成
ほんの数行のコードで以下のようなグラフができちゃいます。

Bokehより簡単だ、、、

スキャッタープロット

コード

1
2
3
4
5
6
7
8
9
10
import numpy as np
import plotly.offline as pyo
import plotly.graph_objs as go
 
np.random.seed(42)
random_x = np.random.randint(1,101,100)
random_y = np.random.randint(1,101,100)
 
data = [go.Scatter(x=random_x, y=random_y, mode="markers")]
pyo.plot(data,filename="scater.html")

 

スキャッタープロット装飾後

コード

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
import numpy as np
import plotly.offline as pyo
import plotly.graph_objs as go
 
np.random.seed(42)
random_x = np.random.randint(1,101,100)
random_y = np.random.randint(1,101,100)
 
data = [go.Scatter(x=random_x,
                   y=random_y,
                   mode="markers",
                   marker=dict(
                       size=12,
                       color="rgb(51,204,153)",
                       symbol="pentagon",
                       line= {"width":2}
                   ))]
 
 
layout = go.Layout(title="hello first plot",
                  xaxis=dict(title="My Y axis"),
                  yaxis=dict(title="My Y axis"),
                  hovermode="closest")
fig=go.Figure(data=data,layout=layout)
pyo.plot(fig,filename="scater2.html")

 

線グラフ

 

コード

線グラフは上記のスキャッタープロットと同じように
go.Scatter()内にmode = ‘lines’を追加する

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
import plotly.offline as pyo
import plotly.graph_objs as go
import numpy as np
 
np.random.seed(56)
x_values = np.linspace(0, 1, 100) # 100 evenly spaced values
y_values = np.random.randn(100)   # 100 random values
 
 
trace1 = go.Scatter(
    x = x_values,
    y = y_values,
    mode = 'lines'
)
 
data = [trace1]  # assign traces to data
layout = go.Layout(
    title = 'Line chart showing three different modes'
)
fig = go.Figure(data=data,layout=layout)
pyo.plot(fig, filename='line0.html')

 

複数の線グラフ

 

コード

mode = ‘markers’
mode = ‘lines+markers’
mode = ‘lines’

の3種類を並べてみます
y_valueに+5、0、-5をそれぞれ加えて位置をずらしています。
name=”〇〇”と記述するとグラフの名称が表示されるようになります。

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
import plotly.offline as pyo
import plotly.graph_objs as go
import numpy as np
 
np.random.seed(56)
x_values = np.linspace(0, 1, 100) # 100 evenly spaced values
y_values = np.random.randn(100)   # 100 random values
 
# create traces
trace0 = go.Scatter(
    x = x_values,
    y = y_values+5,
    mode = 'markers',
    name = 'markers'
)
trace1 = go.Scatter(
    x = x_values,
    y = y_values,
    mode = 'lines+markers',
    name = 'lines+markers'
)
trace2 = go.Scatter(
    x = x_values,
    y = y_values-5,
    mode = 'lines',
    name = 'lines'
)
data = [trace0,trace1,trace2]  # assign traces to data
layout = go.Layout(
    title = 'Line chart showing three different modes'
)
fig = go.Figure(data=data,layout=layout)
pyo.plot(fig, filename='line1.html')

 

Filed Under: Plotly/Dash

Primary Sidebar

カテゴリー

  • AWS
  • Bootstrap
  • Dash
  • Django
  • flask
  • GIT(sourcetree)
  • Plotly/Dash
  • VPS
  • その他tool
  • ブログ
  • プログラミング
    • Bokeh
    • css
    • HoloViews
    • Jupyter
    • Numpy
    • Pandas
    • PosgreSQL
    • Python 基本
    • python3
      • webアプリ
    • python3解説
    • scikit-learn
    • scipy
    • vps
    • Wordpress
    • グラフ
    • コマンド
    • スクレイピング
    • チートシート
    • データクレンジング
    • ブロックチェーン
    • 作成実績
    • 時系列分析
    • 機械学習
      • 分析手法
      • 教師有り
    • 異常値検知
    • 自然言語処理
  • 一太郎
  • 数学
    • sympy
      • 対数関数(log)
      • 累乗根(n乗根)
    • 暗号学

Copyright © 2023 · Genesis Sample on Genesis Framework · WordPress · Log in