2018年04月17日

[自炊] PDFかCBZにまとめる

 スキャンして連番画像にしたファイルは、そのままだと扱いにくい。誤って一部のファイルを削除してしまいそうだし、ファイル数が多いと移動やコピーに時間がかかりそうだ。
 なのでファイルを1つにまとめるのだが、主に2つの方法がある。

 1. PDFにする
 2. CBZ(ZIP)にする

PDF

●利点
 ・OCRで透明文字を埋め込めば検索ができる
 ・右綴じか左綴じか設定しておける

●欠点
 ・ビューワーでの動作が重い
 ・アドビのビューワーがバージョンアップで年々使いにくくなる
 ・他のいいビューワーが少ない
 ・埋め込んだ文字は編集できない。OCRのミスを修正できない

CBZ

 CBZは、ZIPの拡張子を「cbz」に変更しただけのもの。だが電子書籍のフォーマットとして普及しており、電子書籍リーダーが対応している。例えば Android の Perfect Viewer は、CBZの最初の画像をサムネイルとして表示する。

●利点
 ・簡単に作成できる
 ・いろんなビューワーで開ける

●欠点
 ・文字の埋め込みはできない。検索はできない
 ・目次や右綴じ左綴じなどの設定もできない

文字はPDFかCBZ、漫画はCBZ

 細かい点を除けば、PDFの利点は透明文字の埋め込みだけだ。だから、

 ・文字の本……PDFかCBZ
 ・漫画  ……CBZ

 になる。

CBZの作り方・使い方

●圧縮
 CBZを作る際は、無圧縮のZIPでいいと思う。JPEGはすでに圧縮されているため、ZIPで再圧縮してもファイルサイズはほとんど減らない。処理時間が無駄にかかるだけだと思う。
 無圧縮のZIPは 7-Zip で作れる。

●サムネイル
 Windowsでは、CBXShell を入れればサムネイルが表示される。

●Massigraなどのビューワーで開く
 中身はZIPなので、ZIP用のプラグインを入れる。ただし拡張子cbzに対応できないといけないので、拡張子の追加ができる ax7z.spi を使う。
 Massigraなら[その他>プラグイン設定...>書庫用プラグイン>ax7z.spi>設定...>User defined]に「;cbz」と追加する。

posted by 葛 at 21:48 | Comment(0) | 自炊(電子書籍)

2018年04月01日

[自炊] 表紙のスキャン・処理

 表紙が汚れている場合、解体前にエタノールで拭く。ゴミがあると縦筋が入る原因になるし、後でグラフィックソフトでスキャン画像のゴミを除去する手間も省ける。

スキャン

 表紙カバーのスキャン方法は、以下の2つがある。

  A. スキャナの長尺モードで全体を一度にスキャンする。後にグラフィックソフトで[表紙・そで(折り返し)・裏表紙]を分割する

  B. [表紙・そで・裏表紙]をカッターで切り離し、別々にスキャンする

 速度は大して変わらないと思うので、得意な方を選べば良い。

 背表紙(題名の書いてある部分)は、表紙に付属させる。そうしないと電子書籍リーダーで表紙を表示したとき、右開きか左開きかわからない。
 [そで・裏表紙・中表紙]は、必要な情報があれば残す/スキャンする。

●画像の保存形式
 後処理でモアレ除去するために倍の解像度でスキャンした場合、かなり大きいサイズになる。なので高画質のJPEGで保存してもいい。解像度を半分に縮小すると弱いノイズは消えるので問題ない。

モアレ除去

 スキャン時にモアレ除去をしなかった場合、XnConvert などでモアレ除去をする。XnConvert で使う動作は以下の通り。

●フィルタ>ぼかし
 アミ点をぼかして消す。100でちょうど良い。

●画像>リサイズ
 解像度を半分にした上で、スキャナで読み込んだ画像はやや縦長になるので縦を縮める。
 自分のスキャナがどれだけ縦に伸びるか調べて、[幅:50%|高さ:49.85%]という具合にする。
 リサンプルは「Lanzos」が一番シャープなのでこれを選ぶ。

●画像>回転
 長尺モードでスキャンした表紙カバーは90°傾いているので、-90°とかにして直す。

−−

●出力
 この後グラフィックソフトで加工・分割するための一時ファイルの場合は、保存形式は何でもいい。
 画質にこだわるならTIFFがおすすめ。圧縮されるがノイズが出ない。処理速度も遅くない。圧縮方式は「LZW」「LZW+Predictor」。
 画質にこだわらないなら高画質のJPEGでいい。どうせ最後はJPEGになる。

●ファイルの扱い
 モアレ除去の作業は後でやり直すことはまずないので、元のスキャンした画像は削除していい。モアレ除去後の画像はバックアップのために保管しておくので、subフォルダなどに入れておく。

色調補正&トリミング

 表紙は重要な部分なので、XnConvert ではなくグラフィックソフトで色を補正・トリミングする。
 長尺モードで全体を一度にスキャンした前提で手順を書く。

●傾きを補正
 フォトショップであれば[ものさしツール>レイヤーの角度補正]が速い。

●トリミング
 上下左右のすき間(原稿のない部分)を切り取る。 
 [そで・裏表紙]が不要ならここで切り取る。

●色調補正
 色とコントラストを調整する。
  |
 ◎色
  ・画像に本来白い筈の部分がある場合、フォトショップであれば[レベル補正>先の白いスポイトツール]で白い筈の部分をクリックすると、そこが白くなるように明るさと色を自動的に補正する。
  ・黄ばんでいるが画像に本来白い筈の部分がない場合、カラーバランスで調整する。補色の青と、緑を少し上げる。
  |
 ◎明&暗
  ・基本的に、レベル補正でヒストグラムの右端と左端の余白がなくなるあたりにする。後は見た目で調整する。

●ゴミを消す
 ゴミが目立つなら、[ブラシ・スタンプ・修復ブラシ・パッチ]ツールなどで消す。

●縦の解像度を本文に合わせる
 本文の画像を先に作業しておき、縦の解像度をそれに合わせる。見開きで表示したときに高さがずれないようにするため。横幅は合わせなくてもいい。

●[表紙・そで・裏表紙]を切り離して保存する
 JPEGで保存する。背表紙は表紙に付属させる。

ページ数をどうするか

 表紙は0ページ(_000)にする。
 表紙は最初に持ってくると、大抵の環境でサムネイルとして表示される。

 [そで・中表紙・裏表紙]は、本文の後に持って行くのがいいと思う。本文は大抵1ページから始まるので、本文の前に持ってくると、ページ数とファイルの連番が一致させにくい。
 本文の最後のページが300ページだったら、そで1を301ページ、そで2を302ページ、裏表紙を303ページ、中表紙を304ページという風にする。

posted by 葛 at 18:54 | Comment(0) | 自炊(電子書籍)

2018年03月31日

[自炊] XnConvertで明るさ補正・トリミングする

 傾きを補正した画像は、次に明るさを調整し、トリミング(不要な部分を切り取る)する。

 複数の画像をまとめて加工できるソフトが必要になる。
 Photoshop のアクションを使うとそういうことができるのだが、これだけのために毎月1000円くらいを払うのは嫌だ。それに高機能な分、使いにくい。
 フリーのそういうソフトをいくつか試したところ、XnConvert が使いやすかった。

使い方

・画像を全選択して「入力」タブ内にドロップする
・「動作」タブで画像を加工する

 加工前/加工後を確認するには、「変換前/変換後」を切り替える方法と、動作のチェックをオンオフする方法がある。
 「変換前/変換後」は、拡大しているときに使うと位置がずれてうまく確認できない。また一部の動作だけの効果を確認することができない。なのでチェックのオンオフを使うことが多い。

追加する動作

 「動作を追加」から、以下の項目を追加する。

●画像>深度を変更
 グレースケール画像(8bit)を読み込んでも、そのまま出力するとカラー(24bit)になってしまうので、ここで「グレースケール(256)」を指定する。元がカラー画像なら不要。
 [JPEGはディスク上では圧縮されるため、モノクロの画像なら8bitでも24bitでもファイルサイズはあまり変わらない。しかしアプリで画像を開いたときはメモリ上に展開されるため、カラー(24bit)のメモリ消費量はグレー(8bit)の3倍になる]

●画像>リサイズ
 スキャナで読み込んだ画像は少し縦に伸びているので縮める。
 モードを「ズーム調整」にして、[幅:100%|高さ:99.7%]「パーセント」などとする。
 事前に、自分のスキャナがどれだけ縦に伸びるか確認しておく。

●マップ>カラーバランス
 黄ばんだカラー画像を扱う際、黄ばみを消す。
 黄色の補色である青を上げる。黄ばみがオレンジ寄りなら、緑も少し上げる。
 画像の、本来白い筈の部分が実際に白く(RGB値が均等に)なるように調整するのだが、RGB値を調べるツールがない。仕方ないので厳密にやりたいならスクリーンショットを撮って(Alt+PrintScreen)ペイントソフトで調べる。

●マップ>レベル
 コントラストを調整して、紙のざらざらした質感と裏写りを白く飛ばし、黒を引き締める。

 紙の質感が残っていると、情報量が増えるためファイルサイズが増える。白で飛ばすと明るすぎるというなら、読むときに電子書籍リーダーの明るさを下げる。
 ただしカラー原稿で地色などが入っている場合は、白飛ばしさせずに残す。
  |
 白で飛ばすのも黒を引き締めるのも、なるべく文字が痩せない/太らないようにする。文字が読みにくくなるため。

  |
 紙の質感を飛ばしつつも文字が痩せないようにするわけだが、両立できない場合は、文字が痩せないのを優先した方がいい。多少質感が残ってもファイルサイズが少し増える程度だが、文字が読みにくくなるのは目に悪い。
  |
 値は、スキャナや紙の色にもよるが、スキャン時に色調整をしてない場合のグレーだと大体、黒70/白240あたり。

●画像>キャンバスリサイズ
 画像の上下左右の余白をある程度切り取り、サイズを揃える。
 サイズがバラバラだと、電子書籍リーダーで見開きで表示したときに左右の大きさが不揃いで見苦しい。
  |
 また、スキャンしたままだと縁に筋が入る場合がある。

 大抵の電子書籍リーダーには余白を省略して表示する機能があるが、これは余白が無地じゃないと使えない。縁があると余白と判定されないので、縁を切り取る。
  |
 同じ大きさの本を続けて作業すると、キャンバスリサイズのサイズをあまり変えなくて済む。

出力する

 「出力」タブで出力先と形式を選択する。
 毎回出力場所を指定するのは面倒なので、出力用のフォルダを作り、そこに出力されたファイルを手作業で移動させる。

 ここでの出力が最終ファイルになるので、JPEGで出力する。画質は以前書いたように80あたりを推奨する。

確認する

 動作の中で特にキャンバスリサイズは、縁が残っている/必要な所まで切り取っている可能性があるため、作業後にざっと確認する。
 Massigraで見開き表示にしてホイールをコロコロさせるとすばやく確認できる。見開き表示にすると画像同士が隣接するため、縁が残っているか確認しやすくなる。

posted by 葛 at 20:29 | Comment(0) | 自炊(電子書籍)