★ 手抜きしたい
前回は、グーグルレンズのOCR機能を使ってスマホで電子書籍を作ってみた。
時間はかかったが自分としては満足している。テキストデータにしてしまえば容量も小さいし、フォントの種類・色・大きさを変えて読みやすくすることもできるし、音声で読み上げさせることだって可能だ。これって、サステナブル?
しかしながら、OCRでのテキスト化は誤読ゼロとはならないため、どうしても校正作業が必要になってしまう。この労力が馬鹿にならない。
そこで、今回は「校正しない」電子書籍化――画像での保存にチャレンジしてみた。
ひとまずは、撮影したページを jpg 画像として保存し、zip ファイルにまとめる方法でやってみようと思う。
方法としては pdf 化のほうが主流なようだが、自分としてはわざわざ画像を pdf にする意義がよくわかってない。
テキストではなく画像として読み取るのであれば、そのまま jpg として保存した方が後々の汎用性が高いと思っている。必要であればさらにOCRテキスト化もできるんだし、どうなんだろう。画像の pdf 化ってどんなメリットがあるの?
さて。
できなくはないとはいえ、作業効率を考えるとさすがに追加投資ゼロ円のままでは難しい。
かといって、いきなりドキュメントスキャナーを購入しての「自炊」はおサイフに拒否られるし、まだ本は解体したくない。
そこで、「タイトルに偽りあり」となってしまうが、ちょっとだけ投資。
前回、グーグルレンズを使ったOCRテキスト化の際にも困っていたのが、シャッターを押す際にスマホがブレたり、本を片手で押さえるためページがよれたり反ったりしてしまうことだ。
そこで、シャッターを押す際のブレを無くし、両手で本を広げたままでも撮影できるよう「スマホ・アームホルダー:Bluetooth シャッター付き」(クーポン割引で 2,315円)を楽天で購入してみた。スマホで上から見下ろす俯瞰撮影ができるタイプだ。
ちなみに、このアームを使ってOCRテキスト化を試してみたところ、本文をまとめて撮ってしまってから順にグーグルレンズに読み込ませることで効率的に文字認識させることができた。なぁんだ、もっと早く買っておけば良かった。
★ きれいに撮ろう
普通にスマホのカメラで小説本文を撮影すると、ペ-ジを押さえる指や開いた本の厚みによる影、紙のしなりによる文字の歪みなどが出てしまう。まあ、当然でしょうね。
最低限、これでも読めるから絶対ダメってわけじゃないんだけど……。読んでいてもなんか気になってしまう。やっぱ、電子書籍っていうからには、もう少しキレイなものにしたい。
で、何かないかとアプリを探してみた。
すると、紙のしなりによる文字のゆがみを自動補正してくれるスキャナーアプリ、vFlat Scan が見つかった。
アームにスマホをセットして角度や高さを調整、スタンドライトを点けて、リモコンシャッターを Bluetooth で接続し、いざ撮影会。
両手を使って本を広げ、1ページづつ撮影してゆく。
最初はシャッターを右手で押していたが、撮影ページを広げる手だと押しにくく感じたため、途中からは撮影ページごとに左右の手で交互にシャッターを持ち替えて押していった。
全258ページ、ひとまず撮影は2時間くらいで終わった。慣れればもう少し短くできるかもしれない。
vFlat Scan には、本を押さえた指を自動的に消してくれる機能もあったのが嬉しかった。ありがたや。
パソコンに撮影データを転送してビューアーで内容をチェックしてみると、一部の文字がかすれてしまったものやピントがあわずボケてしまっているものが50枚余りもあった。
これらについては、撮影中にも注意しつつ、ミスしたと思ったものは再撮影していたのだが、それでも思ったより撮影ミスが多かったことになる。
ピンボケはオートフォーカスとシャッタータイミングのズレが原因で慣れてしまえば問題ないのだが、文字のかすれは照明のムラが原因だった。
スマホの影がでないようにと自宅にあった卓上型LEDスタンド2個を使って左右から照らしたのだが、同一ペ-ジ内であってもスタンドからの距離の違いで明るさにムラがでてしまう。
カメラが暗い側の文字をきれいに撮ろうとして絞りを開くのか、明るい側の文字が白地のハレーションで細くかすれたようになってしまうのだ。
まあ、これらはどうしようもないので再撮影を実施。
文字を飛ばさないよう照明を抑えてみたのだが、明るさが足りないと指が消えず、紙の地色も写ってしまうので、そのさじ加減が難しかった。
再撮影したものと入れ替えてさらにチェックをしてゆくと、まっすぐに置いて撮ったつもりなのに微妙に傾いているものが結構ある。
これについては、 No.722 さんが公開されている eTilTran と chainLP というソフトを使ってみた。
パソコン上で画像の傾きを補正したり、余白をカットしてくれるソフトだ。そのほかにもノンブルの除去や再配置、2段組みを1段組みに変更することもできるらしい。
あまりに高機能なため理解不足のまま基本機能だけで使ってみたのだが、それでも何とか見られるものができたので、これを zip でまとめて完成とした。感謝。
だが、完成した電子書籍をスマホで読んでみると、なんだがピントが合わせづらいような気がする。
何でだろうと拡大して確認してみると、画像の文字がボケて滲んだようになってることがわかった。
vFlat Scan で撮った最初のデータと比べてみると、データサイズが10分の1になっている。画像を縮小しているため文字の輪郭に曖昧さが出てしまったようだ。
うわぁ、どうしよう。文字がボケちゃうのは眼に悪そうだよなぁ、最初のサイズに戻した方がいいのかなぁ、としばらく悩んが、ビューアーアプリのコントラスト等を調整することでリカバーできそうだったのでひとまず良しとした。
電子書籍自炊には「どこまでクオリティを求めるか」の問題がある。
本をバラしてドキュメントスキャナーで読み込むならともかく、非破壊自炊にはおのずと限界もあるだろう。
お手本としたブログにも「理想は求めない方が良い」との注意書きもあったし、妥協することは決して何かに負けたじゃない。
最終的に保存した jpg データからちゃんとOCRテキスト化できることも確認できたので、今回は以上で作業終了としたい。
次回は、ちょっと趣旨がズレてしまうかもしれないが、(その3)として市販電子書籍について考えてみたいと思っている。
★★ 追記その1:二番目に思いついた冴えたやりかた
その後、2冊め、3冊目といろいろ試しながらやってみたが、逆L字に本を開いて片側ページのみを連続撮影してゆく方法が一番効率的だと気付いた。
撮影のために本の位置を左右に動かす必要がなく、ページをめくるだけでスピーディーに撮影ができる。
奇数ページを順に撮り終えたら、本をひっくり返して偶数ページも順に撮影してゆく。
当然、画像も逆さまになってしまうが、これはウィンドウズ・エクスプローラーの基本機能で対処できた。
奇数ページと偶数ページを別フォルダに保存し、逆さまになっているフォルダの画像ファイルを全部選択して「右(左)に回転」を2回繰り返せばOK。
あとは、以下の手順でページ順にそろえてゆく。
(1) 奇数・偶数各フォルダ内の画像ファイルをページ順に連番を付けて同じ名前に
変える
(2) 偶数ページのファイル名に適宜の文字を追加する
この、「末尾に適宜の文字を追加」するには Flexible Rename 等のフリーソフトを使っても良いが、自分はコマンドプロンプトから当該フォルダに移動して、
for %A in (*) do ren "%A" "%~nA_b%~xA"
を実行し「_b」の文字を追加してみた。
(3) 全部のファイルを同一フォルダにコピーして名前で並び替え
わかりやすくしたければ、ここであらためて MyBook(101)~MyBook(400) のように連番にリネームしておいても良いだろう。
これを zip にまとめて一冊できあがり、だ。
この方法で撮影してみると、300ページ余りの本を1時間半くらいで撮り終えることができた。
内容をチェックして撮影ミスしたページを再撮影しても3時間はかからなかった。「非破壊自炊」としては、まあまあの効率ではないだろうか。
絶版・品切れで購入できない本でも、図書館から借りて電子化して「積読」することが可能なレベルで、コレクター欲がまた膨れ上がってしまいそうだ。(^^;)
★★ 追記その2:ちょっと手順を変えてみた
前回、逆さまになった画像をエクスプローラーで修正したが、ビューアーによっては修正されず逆さまのまま表示されるものがあった。(回転信号のみを付加してるんだろうか?)
そこで、逆さま画像の修正には、直感的に使いやすかった nilpo 氏の「Ralpha」を使用することにした。
また、「eTilTran」を使って余白をカットし、文字部分のみをトリミングしたものをスマホ用に作成してみた。
指定した範囲のトリミングなら上記の「Ralpha」でも可能だが、「eTilTran」は文字部分を自動認識して切り出してくれるので、それを拡大縮小・上下左右移動させて微調整しながら1ページ内(赤枠内)にちょうど収まるよう合わせてみた。
パソコンやタブレットならそのままでも読めたのだが、5.8インチのスマホだとギリギリまで大きく表示しないと文字が小さくて読むのがキツかったので、もうひと手間かけてみたわけだ。これでなんとか。
★★ 追記その3:段組の再配置を試してみた
前回、「eTilTran」を使って余白をカットし、文字部分のみをトリミングしたものをスマホ用に作成してみたが、すべてのページがトリミング範囲内に収まっているか確認して微調整することが必要であり、これにけっこう時間をとられてしまっていた。
また、トリミングはしてみたものの、元本によってはまだまだ文字が小さいものもあったので、「MeTilTran」を試してみることにした。
1ページごとの画像だったものを、1文字づつの画像に分離して再配置するもので、2段組のものを平組にすることも可能だという。
詳しいマニュアルが見当たらなかったもので、元データを読み込ませて思いつくまま試行錯誤したところ、なんとか読めるものができあがった。
嬉しいことに、最初に出力設定さえしておけば各ページごとに調整する必要もなく、その意味ではずいぶんと省力化になることがわかった。
残念ながら、スキャンした画像のゆがみを補正してくれる vFlat Scan でも限界があるため、どうしても文字が斜めになってしまうこともある。再配置を実施すると行のつなぎ目がガタついたり文字の片側が削れたりしてしまうこともあるが、とりあえず読むことは可能なので許容範囲だと思いたい。
使い方を完全に理解しているわけではないので、もしかするとこれも調整することができるのかも知れないが、ここまででも個人的には十分に助かっている。
560ページ余の単行本をスマホサイズに変換すると1200ペ-ジを超えてしまったが、5.8インチの画面でもラクに読めるので、隙間時間を利用して読書ができている。
★★ 追記その4:クオリティを高める
「MeTilTran」のマニュアルの所在が不明だったので、いろいろと試行錯誤したところ次の3点について修正方法がわかったので記録しておきたい。
① ページの合わせ目の影など不要なゴミ画像の除去
② 行の誤認識による文字の左右分割
③ 改行まちがい
① は、グループ編集モードにして、不要なブロックの番号を選択して削除する。
② については、行編集モードにして、分割されている行を選択し「隣接行融合」ボタンで一行にまとめる。
③ については、不要ブロック等の長さに合わせて文字行ブロックの下限を誤認識してしまったことが原因なので、グループ編集モードにして不要ブロックを削除したのちに、文字行ブロックを選択して余分な余白を入れないように大きさを調整することで、改行を正確に認識させることができる。
作業にも慣れた現在では、250ページくらいの本であれば、撮影に1時間、画像チェック・再撮影・奇偶ページ丁合に1時間、計2時間あまりで電子書籍化できるようになった。
スマーフォン用の版組変更も、上記①~③の状態を気にしない(とりあえず判読は可能だし)のであれば5分もかからずにできてしまう。
クオリティを高めようとした場合にのみ、本稿の修正作業がもう1時間ほど必要となるわけだ。
もっとも、この修正作業さえ終了すれば、修正した内容を「プロジェクト」として保存できるので、スマートフォン用のみならず、タブレット用・PCディスプレイ用ときれいな版組変更が可能となる。
読み方もまた、自由自在ということだろう。
「MeTilTran」を公開されている No.722 さんには、あらためて感謝申し上げます。