-
itemsize,是每個元素的bytes數
查看全部 -
numpy
查看全部 -
def?main() ????lst=[[1,3,5],[2,4,6]] ????print(type(lst)) ????np_lst=np.arry(slt) ????print(type(np_lst))?#ndarry里只能有一種數據類型 ????np_lst=np.arry(lst,dtype=np.float)?#轉化為float ????#bool,int,unint,float,complex等類型均支持 ????print(np_lst.shape)?#打印矩陣的形狀 ????print(np_lst.ndim)?#維度(行數) ????print(np_lst.dtype)?#元素類型 ????print(np_lst.itemsize)?#每個元素的大小,float為8 ????print(np_lst.size)?#所有元素個數
查看全部 -
本節代碼 df1=df.reindex(index=dates[:4],columns = list("ABCD")+["G"]) ? ?df1.loc[dates[0]:dates[1],"G"]=1 ? ?print (df1) ? ?#丟棄數據 ? ?print(df1.dropna()) ? ?#填充數據 ? ?print(df1.fillna(value=1))
查看全部 -
本節代碼 #pandas表統計與整合 ? ?#均值 ? ?print(df.mean()) ? ?#方差 ? ?print(df.var()) ? ?s=pd.Series([1,2,4,np.nan,5,7,9,10],index=dates) ? ?print(s) ? ?print(s.shift(2)) ? ?print(s.diff()) ? ?print(s.value_counts()) ? ?#累加 ? ?print(df.apply(np.cumsum)) ? ?#極差 ? ?print(df.apply(lambda x:x.max()-x.min())) ? ?#表格拼接 ? ?pieces=[df[:3],df[-3:]] ? ?print (pieces) ? ?left=pd.DataFrame({"key":["x","y"],"value":[1,2]}) ? ?right=pd.DataFrame({"key":["x","z"],"value":[3,4]}) ? ?print("LEFT:",left) ? ?print("RIGHT:",right) ? ?print(pd.merge(left,right,on="key",how="outer")) ? ?df3=pd.DataFrame({"A":["a","b","c","d"],"B":list(range(4))}) ? ?print(df3.groupby("A").sum())
查看全部 -
#Basic print(df.head(3)) ?#head()打印出前幾行 print(df.tail(3)) #tail()打印出后幾行 print(df.index) ?#index()打印出索引 print(df.values) ? #values()打印出values print(df.T) ? ? ? ?#T 轉置 print(df.sort(columns="C")) ?#第C列的values按從小到大的順序排序 print(df.sort_index(axis=1,ascending=False)) ?#將index進行降序排序 print(df.describe()) ? #打印出所有屬性值 的數量 平均值 標準差 最小值 最大值等
查看全部 -
list = np.array([[[1, 2, 3, 4], ? ? ? ? ? ? ? ? ? ? ?[4, 5, 6, 7, ]], ? ? ? ? ? ? ? ? ? ?[[7, 8, 9, 10], ? ? ? ? ? ? ? ? ? ?[11, 12, 13, 14]], ? ? ? ? ? ? ? ? ? ?[[15, 16, 17, 18], ? ? ? ? ? ? ? ? ? ?[19, 20, 21, 22]] ? ? ? ? ? ? ? ? ? ? ]) axis取值跟維數有關,維數從 0 開始算起,axis值越大,深入的程度越深 print (list.sum(axis=0))# axis表示維度,sxis=0,表示最外層的元素相加 print (list.sum(axis=1))# 表示最外層減一層的元素相加 print (list.max(axis=0)) # 最外層元素中的最大元素值 print (list.min(axis=0)) # 最外層元素中的最小元素值 list1 = np.array([10, 20, 30, 40]) list2 = np.array(([4, 3, 2, 1])) print(list1 + list2) # 對兩個list中的元素相加,ps:不是將一個數組中的元素放在另一個后面 print (list1-list2) # 對兩個list中的元素相 print (list1**2) # 對兩個list中的元素平方 print (list1/list2)# 對兩個list中的元素相除 print (list1.reshape([2, 2])) print (list2.reshape([2, 2])) print (np.dot(list1.reshape([2, 2]), list2.reshape([2, 2]))) # 數組點乘 print(np.concatenate((list1,list2),axis = 0)) #將兩個數組相連,即list2添加到list1中,傳的是tup
查看全部 -
python 中的 list 可以放多種類型,numpy 底層是 C 寫的,為了達到運算速度,我們要求他只能裝下一種類型,可以定義他只能裝的數據類型。
放入初始化的 list 的時候可以同時指定裝入的類型 x=np.array(lst,dtype=np.float) 指定數據類型的時候要以 np. 開頭
查看全部 -
#encoding=utf-8 ?//編碼方式
? import numpy as np ? //引人numpy 并用np簡化
def startMain(): ? ? ? ? ? ? ? ? ? ? ? ? //模板
? ? ? ?pass
if _name_=="_main_‘’:
?startMain()
查看全部 -
#常用array操作 list = ?(np.arange(1, 11)) #產生一個1-11(不含11)的等差數列 list = ?(np.arange(1, 11)).reshape([2, 5]) # 變成兩行五列數組 print (np.exp(list)) ?# list 的自然指數 print (np.exp2(list)) # list 的自然指數的平方 print (np.sqrt(list)) # list 的開方 print (np.square(list)) # list 的平方 print (np.sin(list)) # list 的正弦值 ? ?print (np.log(list)) # list 的對數值 print (np.vstack((list1,list2))) #將兩個數組分成兩行組成一個數組也就是以行連接,注意傳的是個tuple print (np.hstack((list1,list2))) #將兩個數組相連組成一個一維數組,傳的是tup print (np.split(list1,n)) #將數組 list1 切分成n個子數組 print (np.copy(list1)) #對數組進行拷貝
查看全部 -
print (np.zeros([2, 4]))#輸出元素都為0的2行4列數組 ? ?print (np.ones([3, 5]))#輸出元素都為1 的2行4列數組 ? ?print ("Rand:") ? ?print (np.random.rand(2, 4))#輸出2行4列的隨機數組 ? ?print (np.random.rand())#生成一個隨機數 ? ?print (np.random.randint(1, 14, 5))#在1到14之間生成5個隨機數 ? ?print (np.random.randn(2, 4))#輸出2行4列標準正態分布隨機數 ? ?print np.random.choice([10.20, 41])#在列表中的數隨機選取一個 ? ?print (np.random.beta(1,10, 100))#生成一個1-10共100個beta數組
查看全部 -
np.array 用來創建一個numpy數組。 np.shape 顯示np數組屬性 np.ndim 表示數組維度 np.dtype表示數組元素類型(如:int8,in16,float64等) np.itemsize表示數組元素所占字節大小,如float64占字節8位 np.size表示數組元素個數
查看全部 -
使用python做數據分析,學工具查看全部
-
print(np.zeros[2,4]))#打印出2行4列的0
print(np.ones([3,5]))#打印出3行5列的1
print(“Rand:”)
print(np.random.rand(2,4))#0-1之間2行4列的隨機數
print(np.random.rand())#不加參數只有一個隨機數
print(“RandInt:”)
print(np.random.randint(1,10,3))范圍1-10隨機生成個3整數
print(“Randn:”)
print(np.random.randn(2,4))#標準正態布的兩行四列的數
print(np.random.choice([10,20,30]))#三個數中選一個打印
print(“Distribute:”)
print(np.random.beta(1,10,100))#打印1-10中符合beta分布的100個數
h2 { margin-top: 0.19in; margin-bottom: 0.19in; direction: ltr; color: rgb(0, 0, 0); text-align: left; break-after: auto; }h2.western { font-family: "宋體", serif; }h2.cjk { font-family: "宋體"; }h2.ctl { font-family: "宋體"; font-weight: normal; }p { margin-bottom: 0.1in; direction: ltr; color: rgb(0, 0, 0); line-height: 115%; text-align: justify; }p.western { font-family: "Calibri", serif; font-size: 10pt; }p.cjk { font-family: "宋體"; font-size: 10pt; }p.ctl { font-size: 12pt; }a:link { color: rgb(0, 0, 255); }
查看全部 -
機器學習監督學習與無監督學習。機器學習的本質是一個函數。機器學習使用訓練好的算法或者函數對歷史數據進行處理,得出我們想要的結果。根據結果的不同,我們把機器學習分成以下幾類
如果不在打標記的情況下得出的結果我們稱之為無監督學習,如聚類和關聯規則
如果提前進行打標記處理,那么就是監督學習。根據打標記的數據是離散的還是連續的,我們又進一步分為分類(結果是有限、離散的)和回歸(結果是連續的)。數據挖掘和機器學習的一般步驟是數據預處理數據建模結果驗證,這個工具包具體要結合自己的論文和實習進行整理。查看全部
舉報