亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

計算兩數的漢明距離

標簽:
PHP 大數據

计算两个整数的汉明距离


一般在对比文件内容的时候用的比较多,比如:对比两个文件内容相似度。
如果对内容查重感兴趣可以看我另一篇文章:《使用SimHash进行海量内容数据查重》

<?php

/**
 * @param Integer $x
 * @param Integer $y
 * @return Integer
 */
function hammingDistance(int $x, int $y) {

    //计算整个整数的二进制值
    $x_hash = decbin($x);
    $y_hash = decbin($y);
    
    //使两个整数转换出来的二进制统一长度 - 左边填充 0
    $x_hash = str_pad($x_hash, 64, '0', STR_PAD_LEFT);
    $y_hash = str_pad($y_hash, 64, '0', STR_PAD_LEFT);

    //计算汉明距离
    $result = hd($x_hash, $y_hash);

    return $result;
}

/**
 * @param Integer $x
 * @param Integer $y
 * @return Integer
 */
function hd(int $h1, int $h2)
{
    $dist = 0;
    for ($i=0;$i<64;$i++) {
        if ( $h1[$i] != $h2[$i] )
            $dist++;
    }
    return $dist;
}

$result = hammingDistance(1,4);
print_r($result);

?>
點擊查看更多內容
1人點贊

若覺得本文不錯,就分享一下吧!

評論

作者其他優質文章

正在加載中
感謝您的支持,我會繼續努力的~
掃碼打賞,你說多少就多少
贊賞金額會直接到老師賬戶
支付方式
打開微信掃一掃,即可進行掃碼打賞哦
今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與 放棄機會
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

舉報

0/150
提交
取消