我想創建一個新列,它是每個 TimePeriodId 的“BillType”列中“IN”和“SA”的生命總和。這樣,我將為單個 TimePeriodId 設置一個“總生命數”條目。我已經瀏覽了很多文檔,但無法弄清楚在這種情況下我會怎么做。代碼示例:sa = pd.read_sql(sa_q1, sql_conn)#convert TimePeriodId to string valuessa['TimePeriodId'] = sa['TimePeriodId'].astype(str)sa = sa.loc[(sa['BillType'] =='SA') | (sa['BillType']=='IN')]#.drop(['BillType'], axis = 1)sa.head(10).to_dict()#the last line returns the following:{'TimePeriodId': {1: '201811', 2: '201811', 4: '201812', 5: '201812', 9: '201901', 11: '201901', 13: '201902', 14: '201902', 17: '201903', 18: '201903'}, 'BillType': {1: 'IN', 2: 'SA', 4: 'IN', 5: 'SA', 9: 'SA', 11: 'IN', 13: 'IN', 14: 'SA', 17: 'IN', 18: 'SA'}, 'Lives': {1: 1067, 2: 288028, 4: 1058, 5: 287501, 9: 293560, 11: 1068, 13: 1089, 14: 278850, 17: 1076, 18: 276961}}任何幫助,將不勝感激!
1 回答

GCT1015
TA貢獻1827條經驗 獲得超4個贊
首先找到您的可執行文件的安裝位置blastp,并將其作為參數提供給NcbiblastpCommandline.
from Bio.Blast.Applications import NcbiblastpCommandline
blastp_path = r"C:\path\to\blastp.exe"
result = r"C:\Users\Uzytkownik\Desktop\tests\result.xml"
q = r"C:\Users\Uzytkownik\Desktop\tests\fastas\my_example2.faa"
database = r"C:\Users\Uzytkownik\Desktop\tests\my_examplemultif.faa"
blastp_cline = NcbiblastpCommandline(cmd=blastp_path, query=q, db=database, evalue=0.001, outfmt=5, out=result)
如果你現在這樣做,print(blastp_cline)它應該打印出將要運行的完整命令。通過復制/粘貼此輸出并從命令行運行它來仔細檢查它是否有效。如果可行,那么
stdout, stderr = blastp_cline()
也應該工作。
添加回答
舉報
0/150
提交
取消