亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何在日語窗口操作系統中編碼日語文本?

如何在日語窗口操作系統中編碼日語文本?

C#
冉冉說 2021-10-24 20:33:57
我正在使用 Tesseract 來閱讀日語文本。我從 OCR 收到以下文本。?—¥??? è???±????C++代碼 extern "C" _declspec(dllexport) char* _cdecl Test(char* imagePath)    {        char *outText;        tesseract::TessBaseAPI *api = new tesseract::TessBaseAPI();        // Initialize tesseract-ocr with English, without specifying tessdata path        if (api->Init("D:\\tessdata", "jpn", tesseract::OcrEngineMode::OEM_TESSERACT_ONLY))        {            fprintf(stderr, "Could not initialize tesseract.\n");                   }        api->SetPageSegMode(tesseract::PageSegMode::PSM_AUTO);              outText = api->GetUTF8Text();        return outText;    }C#[DllImport(DllName, CallingConvention = CallingConvention.Cdecl)]        public static extern string Test(string imagePath);        void Tessrect()        {            string result = Test("D:\\japan4.png");            byte[] bytes = System.Text.Encoding.Default.GetBytes(result);            MessageBox.Show(System.Text.Encoding.UTF8.GetString(bytes));        }輸入文件:、上面的代碼在窗口英語中工作正常。但它在窗口日語中不起作用。它在 windows 的 Japanes 操作系統中給出了錯誤的輸出。任何人都可以指導我如何正確使用 Japanes Window 嗎?
查看完整描述

3 回答

?
萬千封印

TA貢獻1891條經驗 獲得超3個贊

您必須首先從 imagePath 制作一個圖像對象。


就我而言,這是通過使用著名的 opencv 來完成的。然后,使用 SetImage 功能。


void detectJpn(cv::Mat& img)

{

    char *outText;


    // Create Tesseract object

    tesseract::TessBaseAPI *ocr = new tesseract::TessBaseAPI();


    ocr->Init(NULL, "jpn", tesseract::OEM_TESSERACT_ONLY);


    // Set Page segmentation mode to PSM_AUTO (3)

    ocr->SetPageSegMode(tesseract::PSM_AUTO);


    ocr->SetImage((uchar*)img.data, img.size().width, img.size().height, img.channels(), img.step1());


    // Run Tesseract OCR on image

    outText = ocr->GetUTF8Text();


    // print recognized text

    std::cout << outText << std::endl; // Destroy used object and release memory ocr->End();


    //ocr->Clear();

    //ocr->End();


    delete ocr;

    ocr = nullptr;

}



int main(int argc, char *argv[])

{

    cv::Mat img = imread(argv[1], cv::IMREAD_UNCHANGED);


    detectJpn(img);     


    return 0;

}

http://img1.sycdn.imooc.com//617552fe00013ff607250058.jpg

查看完整回答
反對 回復 2021-10-24
?
皈依舞

TA貢獻1851條經驗 獲得超3個贊

您正在向非 UTF-8 的窗口發送 UTF-8 文本。您需要在顯示之前進行轉換

這是可能導致問題的代碼(因為它嘗試使用您無法控制的默認系統編碼);byte[] bytes = System.Text.Encoding.Default.GetBytes(result);

您是否嘗試在那里使用 Encoding.UTF8 ?

如果單獨這樣做不起作用,請嘗試在下面的行中將 Encoding.UTF8 更改為 Encoding.Default。



查看完整回答
反對 回復 2021-10-24
  • 3 回答
  • 0 關注
  • 220 瀏覽

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號