OpenOffice.org 3.0 タグ付きPDF問題に関して

前に書いた、タグ付きPDF(Tagged PDF)を出力すると、検索やコピーが変になるPDFが出力されてしまう問題、PDF/Aに設定すると強制タグ付きになるため、この問題が発生するのですが、修正ターゲットが3.1になっているため、3.0では直りません。これ、言語設定の互換性などで発生する問題なので、日本語を使って書くと、確実に発生します。

尚、対処法としては

  • タグ付きPDF、PDF/Aを使用しない。
  • タグ付きで出力してしらばっくれる

実は、この問題が露見するのはAdobe Readerだけなんですよね。

Foxitなどで見ても問題が発生しませんし、Google DesktopやGoogle検索も普通にインデックスしてくれます。

また、仕様的に、これはActualTextのプレースメントの問題なのですが、現状の実装も、してはいけない、という仕様にはなっていないらしいのですよ。

こういう仕様のPDFが増えてきたらAdobe Readerの方でも対処してくれないかな、と淡い希望を持ってたり。

ちなみに、この問題は課題 91740としてOpenOffice.orgのバグデータベースに入っています。