-
#Set 對dataframe的屬性進行設置 sl=pd.Series(list(range(10,18)),index=pd.date_range("20170301",periods=8)) df["F"]=s1 print (df) df.at[dates[0],"A"]=0 #將第0行A列的數值改為0 print (df) df.iat[1,1]=1 df.loc[:,D]=np.array([4]*len(df)) #將D列改為4? print(df) df2=df.copy() #拷貝dataframe df2[df2>0]=-df2 #將所有大于0的數改為負數 print(df2)查看全部
-
#select 選擇數據 切片? print(type(df["A"])) #dataframe 其實是由一個個series組成的 print(df[:3]) #前三行 print(df["20170301":"20170304"]) #利用index進行切片 1號到4號 print(df.loc[dates[0]]) print(df.loc["20170301":"20170304","B","D"]) #1號到4號B列和D列的數據 print(df.at[dates[0],"C"]) #利用at表示特定值 dates[0]:1號 "C":C列 print(df.iloc[1:3,2:4]) #1到3不包括1,2到4不包括2 print(df.iloc[1,4]) #1行4列 print(df.iat[1,4]) print(df.[df.B>0][df.A<0])查看全部
-
#Basic print(df.head(3)) #head()打印出前幾行 print(df.tail(3)) #tail()打印出后幾行 print(df.index) #index()打印出索引 print(df.values) #values()打印出values print(df.T) #T 轉置 print(df.sort(columns="C")) #第C列的values按從小到大的順序排序 print(df.sort_index(axis=1,ascending=False)) #將index進行降序排序 print(df.describe()) #打印出所有屬性值 的數量 平均值 標準差 最小值 最大值等查看全部
-
import numpy as np import pandas as pd def main(): #Data Structure s=pd.Series([i*2] for i in range(1,11)) print(type(s)) dates=pd.date_range("20170301".periods=8) df=dataframe(np.random.randn(8,5)index索引=dates,coloums屬性值=list('ABCDE')) print (df)查看全部
-
import numpy as np import matplotlib.pyplot as plt def run(): # line # -pai ~ pai之間,包含256個點,顯示最后結束點 x = np.linspace(-np.pi, np.pi, 256, endpoint=True) # 定義余弦函數和正弦函數 c, s = np.cos(x), np.sin(x) # 繪圖 plt.figure(1) plt.plot(x, c, color='blue', linewidth=1.0, linestyle='-', label="Cos", alpha=0.2) # r代表red,*代表線型 plt.plot(x, s, "r*", label="Sin") plt.title("Cos & Sin") # 顯示坐標軸 # 軸的編輯器 ax = plt.gca() # spines 是四周的邊線,none代表隱藏 ax.spines["right"].set_color("none") ax.spines["top"].set_color("none") # 位置設置到數據域的 0 位置 ax.spines["left"].set_position(("data", 0)) ax.spines["bottom"].set_position(("data", 0)) plt.show() if __name__ == '__main__': run()查看全部
-
def main(): from sklearn.datasets import load_iris iris = load_iris() print(iris) print(len(iris["data"])) from sklearn.model_selection import train_test_split train_data,test_data,train_target,test_target=train_test_split(iris.data,iris.target,test_size=0.2,random_state=1) from sklearn import tree #決策樹 clf = tree.DecisionTreeClassifier(criterion="entropy") clf.fit(train_data,train_target) y_pred = clf.predict(test_data) #Verify from sklearn import metrics print(metrics.accuracy_score(y_true=test_target,y_pred=y_pred)) print(metrics.confusion_matrix(y_true=test_target,y_pred=y_pred)) with open("D:/test/test.xlsx","w") as f: tree.export_graphviz(clf,out_file=f) if __name__=="__main__": main()查看全部
-
# liner print(np.eye(3)) lst = np.array([ [1.,2.], [3.,4.] ]) # 單位矩陣 print("inv") print(inv(lst)) # 轉置矩陣 print("Transpose") print(lst.transpose()) # 行列式 print("Det:") print(det(lst)) # 特征值和特征向量 print("eig:") print(eig(lst)) ''' 解方程: x + 2y = 5 3x + 4y = 7 解得: x = -3 y = 4 ''' y = np.array([[5.],[7.]]) print("solve:") print(solve(lst, y))查看全部
-
series&dataframe import numpy as np import pandas as pd def main() #data structure s=pd.Series([i*2 for i in range(1,11)]) print(type(s)) dates=pd.date_range('20170301',periods=8) df=pd.dataframe(np,random.randn(8,5),index組件,索引=datescolumns屬性=list('ABCDE')) print (df)查看全部
-
基礎數據結構 基本操作 缺失值處理 統計與整合 時間 繪圖 文件操作查看全部
-
numpy :數據結構基礎 處理大型矩陣 scipy :強大的科學計算方法 matplotlib:可視化套件 pandas:基礎的數據分析套件 scikit-learn:數據分析建模庫 keras:人工神經網絡查看全部
-
數據分析模塊: numpy: 數據結構基礎 scipy: 強大的科學計算方法(矩陣分析、信號分析、數理分析......) matplotlib: 豐富的可視化套件 pandas: 基礎數據分析套件 scikit-learn: 強大的數據分析建模庫 keras: 人工神經網絡查看全部
-
繪圖函數查看全部
-
bumpy:數據結構基礎查看全部
-
np.array 用來創建一個numpy數組。 np.shape 顯示np數組屬性 np.ndim 表示數組維度 np.dtype表示數組元素類型(如:int8,in16,float64等) np.itemsize表示數組元素所占字節大小,如float64占字節8位 np.size表示數組元素個數查看全部
-
第一課查看全部
舉報
0/150
提交
取消