我正试图创建一个泰米尔语的PDF,但我遇到了字体渲染问题。当我使用Baamini字体时,它可以工作,但Baamini中没有英语字体,所以我尝试了其他字体,如latha.ttf,notosans.ttf,azaghi.ttf等,但这些字体在tcpdf或fpdf中不起作用。请协助我们解决此问题,并提前感谢您!
<?php
header('Content-type: text/html; charset=UTF-8') ;//chrome
require_once('tcpdf_include.php');
// create new PDF document
$pdf = new TCPDF(PDF_PAGE_ORIENTATION, PDF_UNIT, PDF_PAGE_FORMAT, true, 'UTF-8', false);
$pdf->setFontSubsetting(true);
$pdf->SetFont('freeserif', '', 12);
$pdf->AddPage();
$utf8text = '<html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"/> </head> <body> <p>தினமும் உங்களை இந்த தோட்டத்து வழியாக செல்லும்போது என்னை கவனிப்பீர்களா என்று திரும்பி திரும்பி பார்த்து செல்வேன். ஆனால் நீங்களோ வெறி பிடித்தது போல் மண்ணை கொத்தி கொண்டிருப்பீர்கள்.</p></body></html>';
$pdf->writeHTML($utf8text, true, 0, true, true);
$pdf->Output('example_067.pdf', 'I');
?>
我的输出为
1条答案
按热度按时间wn9m85ua1#
当PDF输入被解析为UTF-8时,通常会造成损害
我们可以看到图形视觉效果像16,但下面的搜索和提取文本更像UTF-8
现在我不能说是什么影响你自己的样本看不见,但使用两种语言,你需要一种以上的字体类型,或更准确地说,一种以上的字体类型。而那些非传统的字符实际上会在那里,但不是作为传统的文本。
当你这样做,那么我们可以预期,任何设计良好的提取器将看到这两种字体类型,并将输出转换为UTF-8(这通常不是PDF内部字体类型)