亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

博客語言結果的一小部分

博客語言結果的一小部分

一只萌萌小番薯 2022-08-17 16:54:49
我正在使用以下示例試用貝葉斯邏輯語言。1%的女性患有乳腺癌(因此99%沒有)。80%的乳房X光檢查在乳腺癌存在時檢測到乳腺癌(因此20%的人錯過了它)。9.6%的乳房X光檢查在乳腺癌不存在時檢測到乳腺癌(因此90.4%正確返回陰性結果)。我創建了以下代碼:random Boolean Has_Cancer ~ BooleanDistrib(0.01);random Boolean Detect_Cancer ~     if Has_Cancer then BooleanDistrib(0.8)    else BooleanDistrib(0.096);obs Detect_Cancer = true;query Has_Cancer;當我運行它時,我得到以下結果:======== Query Results =========Number of samples: 10000Distribution of values for Has_Cancer    false   0.9245347606896278    true    0.07546523931038764======== Done ========根據博客應該是.true0.0776當我使用100個樣本運行時,我得到這個:======== Query Results =========Number of samples: 100Distribution of values for Has_Cancer    false   0.9223602484472041    true    0.077639751552795======== Done ========我只是想理解為什么。
查看完整描述

1 回答

?
米琪卡哇伊

TA貢獻1998條經驗 獲得超6個贊

BLOG 生成的值是使用似然加權算法 (LWA) 從條件概率圖形模型生成隨機樣本后的點估計值。與示例帖子中的分析值的差異可能是由于隨機抽樣過程的噪聲造成的。


但令人困惑的是,BLOG默認使用相同的固定種子初始化隨機數生成器,因此結果誤導性地看起來像是確定性的。如果將標志添加到運行調用中,您將看到使用其他隨機種子的結果。--randomize


我不知道LWA的理論性質(例如,它綁定后驗意味著有多緊密),但至少對于一個樸素的生成抽樣方案,你生成的手段完全在95%的CI范圍內。下面是一個 Python 示例,模擬 1000 次運行 10K 示例。


import numpy as np

from scipy.stats import binom


np.random.seed(2019)


N, K = 10000, 1000

tp = np.empty(K)


for i in range(K):

    t = binom(n=N, p=0.01).rvs()

    f = N - t

    detect_t = binom(n=t, p=0.800).rvs()

    detect_f = binom(n=f, p=0.096).rvs()

    tp[i] = detect_t / (detect_f + detect_t)


np.quantile(tp, [0.025, 0.5, 0.975])

# array([0.06177242, 0.07714902, 0.09462359])


查看完整回答
反對 回復 2022-08-17
  • 1 回答
  • 0 關注
  • 112 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號