泰米尔字体不出现在TCPDF php库中

s71maibg  于 2023-05-16  发布在  PHP
关注(0)|答案(1)|浏览(126)

我正试图创建一个泰米尔语的PDF,但我遇到了字体渲染问题。当我使用Baamini字体时,它可以工作,但Baamini中没有英语字体,所以我尝试了其他字体,如latha.ttf,notosans.ttf,azaghi.ttf等,但这些字体在tcpdf或fpdf中不起作用。请协助我们解决此问题,并提前感谢您!

<?php

    header('Content-type: text/html; charset=UTF-8') ;//chrome
    require_once('tcpdf_include.php');

    // create new PDF document
    $pdf = new TCPDF(PDF_PAGE_ORIENTATION, PDF_UNIT, PDF_PAGE_FORMAT, true, 'UTF-8', false);

    $pdf->setFontSubsetting(true);

    $pdf->SetFont('freeserif', '', 12);

    $pdf->AddPage();

    $utf8text = '<html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"/> </head> <body> <p>தினமும் உங்களை இந்த தோட்டத்து வழியாக செல்லும்போது என்னை கவனிப்பீர்களா என்று திரும்பி திரும்பி பார்த்து செல்வேன். ஆனால் நீங்களோ வெறி பிடித்தது போல் மண்ணை கொத்தி கொண்டிருப்பீர்கள்.</p></body></html>';

    $pdf->writeHTML($utf8text, true, 0, true, true);

    $pdf->Output('example_067.pdf', 'I');

?>

我的输出为

wn9m85ua

wn9m85ua1#

当PDF输入被解析为UTF-8时,通常会造成损害

我们可以看到图形视觉效果像16,但下面的搜索和提取文本更像UTF-8

现在我不能说是什么影响你自己的样本看不见,但使用两种语言,你需要一种以上的字体类型,或更准确地说,一种以上的字体类型。而那些非传统的字符实际上会在那里,但不是作为传统的文本。

当你这样做,那么我们可以预期,任何设计良好的提取器将看到这两种字体类型,并将输出转换为UTF-8(这通常不是PDF内部字体类型)

தினமும் உங்களை இந்த தோட்டத்து வழியாக செல்லும்போது                                                           clear
என்னை கவனிப்பீர்களா என்று திரும்பி திரும்பி பார்த்து
செல்வேன். ஆனால் நீங்களோ வெறி பிடித்தது போல் மண்ணை
கொத்தி கொண்டிருப்பீர்கள்.

Tiṉamum uṅkaḷai inta tōṭṭattu vaḻiyāka cellumpōtu eṉṉai kavaṉippīrkaḷā eṉṟu tirumpi tirumpi pārttu celvēṉ. Āṉāl
nīṅkaḷō veṟi piṭittatu pōl maṇṇai kotti koṇṭiruppīrkaḷ.
                                                                                              178 / 5,000

Every day as I walk through this garden I will turn back to see if
you will notice me. But you will be raking the soil like a madman.

相关问题