ぼんやりDTP

DTPに関係したりしなかったりするぼんやりとした話をなんとなく。

JPEG ファイルを再エンコード無しで PDF にしたい

JPEG ファイルを再エンコード無しで PDF にしたい

特にMacで。

Acrobat Pro DC で JPEG ファイルを PDF に変換するとどうも画像として再エンコードしてる風で、再エンコードなしでできるかどうかわからないので他に探す。

「img2pdf」が良さそう。

  1. GitHub - josch/img2pdf: losslessly convert images to pdf
    1. josch / img2pdf · GitLab

Macpip3 が入っていれば下記でインストールできる。

$ pip3 install img2pdf

カレントディレクトリで .jpeg の拡張子のファイルをまとめて PDF にしたい場合は下記のようなコマンドで変換できる。

img2pdf *.jpeg -o out.pdf

Xpdf の pdfimages コマンドで JPEGファイルを抽出してファイルサイズを確認してみると、同じバイト数のようだったのでどうもうまくできてるっぽい。

pdfimages -j PDFファイル名 JPEGファイル名のプリフィックス

cmp コマンド MD5 コマンド等を使用して変換前と抽出した JPEG ファイルを比べてみても同一のファイルのようなので img2pdf は期待通りのようだ。

なお、Acrobat Pro DC で「ファイルを単一のPDFに結合」コマンドで作成したPDFから画像を抽出した画像は同一にはならなかったので、再エンコードされている模様。

Acrobat Pro DC で「ファイルを単一のPDFに結合」コマンドの場合、オプション項目をみても再エンコードしないみたいな項目はないので、まあ、そんなものなんだろう。

参考ページ

  1. PDFからJPEGを抽出する
  2. XpdfReader

    1. Download Xpdf and XpdfReader
  3. jpegをPDF, PDFをjpegに変換する際, できる限り画質を劣化せず変換, ... - Yahoo!知恵袋

  4. 画像梱包の詳細情報 : Vector ソフトを探す!

  5. cmpコマンド(バイナリファイルの内容を比較する)

  6. ファイルが同じか比較するには(バイナリ - それマグで!

  7. Create PDF without image compression? | Adobe Community

  8. Convert images to PDF without compression in Acrobat
  9. How do I combine PNGs into a PDF without losing quality? - Graphic Design Stack Exchange