あらゆるPDFをHTMLに変換する「pdf2htmlEX」がすごい

Cheat

上の画像、複雑な計算式が書かれていて(理論計算機科学のチートシートらしい)、一見PDFをブラウザで表示したものかと思ってしまいそうですが、実これHTMLで作られています(cheat.html)。


PDFからHTMLを自動生成するソフト「pdf2htmlEX」のデモとして作られたものらしく、他にもいくつかサンプルファイルがあるのですが、どれを見ても再現性が高いです。GitHubの説明によると、中国語、英語、日本語に対応したオープンソースソフトウェアで、作っているのは中国の方のようです。

Linux、Mac(Homebrew/MacPorts)、Win32用のパッケージもダウンロードできます(Download)。自分で使ってみる場合QuickStartが参考になるでしょう。

奥村先生の運営するTex Wikiにもページがありました(pdf2htmlEX)。

スポンサーリンク