PHP中的preg_match和UTF-8我正在嘗試使用preg_match搜索UTF8編碼的字符串。preg_match('/H/u', "\xC2\xA1Hola!", $a_matches, PREG_OFFSET_CAPTURE);echo $a_matches[0][1];這應該打印1,因為“H”在字符串“?Hola!”中的索引1處。但它打印2.所以它似乎并沒有將主題視為UTF8編碼的字符串,即使我在正則表達式中傳遞“u” 修飾符。我在php.ini中有以下設置,其他UTF8函數正在運行:mbstring.func_overload = 7mbstring.language = Neutralmbstring.internal_encoding = UTF-8mbstring.http_input = passmbstring.http_output = passmbstring.encoding_translation = Off有任何想法嗎?
3 回答
一只萌萌小番薯
TA貢獻1795條經驗 獲得超7個贊
盡管u修飾符使得模式和主題都被解釋為UTF-8,但捕獲的偏移量仍以字節為單位計算。
您可以使用mb_strlen以UTF-8字符而不是字節來獲取長度:
$str = "\xC2\xA1Hola!";preg_match('/H/u', $str, $a_matches, PREG_OFFSET_CAPTURE);echo mb_strlen(substr($str, 0, $a_matches[0][1]));- 3 回答
- 0 關注
- 685 瀏覽
添加回答
舉報
0/150
提交
取消
