$ tesseract --version
tesseract 4.1.1
leptonica-1.79.0 #...etc
$ tesseract ocr_test.png test
obec TREBOHOSTICE 2021
okres Strakonice, Jihocesky kraj
Poéet osob starSich 15 let 274
Poéet osob v exekuci 11
Podil osob v exekuci 4,01 %
Celkovy pocet exekuci 106
Prumérny poéet exekuci na osobu 9.6
Z toho:
podil (pocet) osob s 1 — 9 exekucemi 45% (5)
podil (pocet) osob s 10 a vice exekucemi 55% (6)
PM. 2
CLI输出看起来不错。可能与系统上安装的leptonica的底层版本有关 \ R tesseract包和Linux包的干净编译:
#Linux command line
$ sudo apt install libpoppler-cpp-dev libtesseract-dev libleptonica-dev
#In R
install.packages("tesseract") # version 5.1.0
library(tesseract)
ocr(file.choose())
第4行11的输出看起来不错:
obec TREBOHOSTICE 2021
okres Strakonice, Jihocesky kraj
Poéet osob starSich 15 let 274
Poéet osob v exekuci 11
Podil osob v exekuci 401% |
Celkovy pocet exekuci 106
Prumérny poéet exekuci na osobu 9.6
Z toho: on
podil (pocet) osob s 1 — 9 exekucemi 45% (5) ;
podil (pocet) osob s 10 a vice exekucemi 55% (6) >
1条答案
按热度按时间vnzz0bqm1#
在等待R编译tesseract包的同时,我测试了命令行版本:
CLI输出看起来不错。可能与系统上安装的leptonica的底层版本有关
\
R tesseract包和Linux包的干净编译:
第4行
11
的输出看起来不错: