为解决使用 lwarp 过程中内部调用 poppler 中的 pdftotext.exe 转换 pdf 时出现的文章顺序错误问题,用 pdf-extract 的测试例子改了下做成 pdf2text
用法:
编译后把 pdf2text.exe 复制到 pdftotext.exe 同一目录,找到 lwarpmk.lua 中的 pdftohtml 函数,把
os.execute("pdftotext -enc " .. pdftotextenc .. " -nopgbrk -layout "
.. sourcename .. "_html.pdf " .. sourcename .. "_html.html")改为
os.execute("pdf2text " .. sourcename .. "_html.pdf " .. sourcename .. "_html.html")