JPEG ファイルを再エンコード無しで PDF にしたい
特にMacで。
Acrobat Pro DC で JPEG ファイルを PDF に変換するとどうも画像として再エンコードしてる風で、再エンコードなしでできるかどうかわからないので他に探す。
「img2pdf」が良さそう。
Mac で pip3
が入っていれば下記でインストールできる。
$ pip3 install img2pdf
カレントディレクトリで .jpeg
の拡張子のファイルをまとめて PDF にしたい場合は下記のようなコマンドで変換できる。
img2pdf *.jpeg -o out.pdf
Xpdf の pdfimages
コマンドで JPEGファイルを抽出してファイルサイズを確認してみると、同じバイト数のようだったのでどうもうまくできてるっぽい。
pdfimages -j PDFファイル名 JPEGファイル名のプリフィックス
cmp
コマンド MD5
コマンド等を使用して変換前と抽出した JPEG ファイルを比べてみても同一のファイルのようなので img2pdf
は期待通りのようだ。
なお、Acrobat Pro DC で「ファイルを単一のPDFに結合」コマンドで作成したPDFから画像を抽出した画像は同一にはならなかったので、再エンコードされている模様。
Acrobat Pro DC で「ファイルを単一のPDFに結合」コマンドの場合、オプション項目をみても再エンコードしないみたいな項目はないので、まあ、そんなものなんだろう。
参考ページ