我再次發布,因為我沒有運氣使以下腳本更有效。更多詳情,請查看我之前的帖子,但基本情況如下。我寫了一個腳本來計算一個分數,以及一個基因譜列表的頻率。此處的遺傳圖譜由 SNP 的組合組成。每個 SNP 有兩個等位基因。因此,3 個 SNP 的輸入文件如下所示,其中顯示了所有三個 SNP 的所有等位基因的所有可能組合。該表是在另一個腳本中使用 itertool 的產品生成的: AA CC TT AT CC TT TT CC TT AA CG TT AT CG TT TT CG TT AA GG TT AT GG TT TT GG TT AA CC TA AT CC TA TT CC TA AA CG TA AT CG TA TT CG TA AA GG TA AT GG TA TT GG TA AA CC AA AT CC AA TT CC AA AA CG AA AT CG AA TT CG AA AA GG AA AT GG AA TT GG AA然后我有另一個文件,其中包含一個包含三個 SNP 的權重和頻率的表格,如下所示:SNP1 A T 1.25 0.223143551314 0.97273 SNP2 C G 1.07 0.0676586484738 0.3 SNP3 T A 1.08 0.0769610411361 0.1136 列是 SNP ID、風險等位基因、參考等位基因、OR、log(OR) 和群體頻率。權重用于風險等位基因。主腳本采用這兩個文件,并根據每個遺傳譜的每個 SNP 中每個風險等位基因的對數優勢比的總和以及基于等位基因頻率相乘的頻率(假設 Hardy Weinberg 平衡)計算一個分數。
添加回答
舉報
0/150
提交
取消