人気ブログランキング | 話題のタグを見る
ブログトップ

カクレ理系のやぶにらみ

tamm.exblog.jp

時間のある方はお読みください。軽い気持ちで読み始めると頭が痛くなります。

書籍の電子化のポイント

 文庫本や新書を何冊か電子化してみて、一連の作業のコツがわかってきたので、今回はそれをご紹介します。電子化に興味のない人にはまったく関係のない話です。すいません。

【電子化の手順】
1.電子化したい本をカッターで分冊する
2.それぞれ背表紙を裁断する
3.ドキュメントスキャナーで読取りPDF化する
4.作成されたPDFファイルに編集ソフトで「しおり」をつける
5.iPhoneなどの携帯デバイスにデータを送る

 手順としては以上となります。雑誌でも紹介されているのでご存知の方も多いでしょうが、4の手順に記してある「しおり」をつけることについて触れていない記事ばかり目にします。現状ではiPhoneのアプリには、縦書きされたPDFを検索できるものがないのでせめて目次に載っている内容を「しおり」にしてをつけておかないと、読むときに困るのです。
 「しおり」の作成は手作業となるので、手間がかかりますが、省いてしまうと後で自分が困ることになります。ただし、「俺はそんなのいらねえや」という方は、4の手順は不用となりますので、一連の作業は大幅に短縮されることになります。

【電子化のために必要な道具】
1.カッター
 本を分冊するために必要。分冊というのは、のり付けされている背表紙の部分をカットしなければならず、そのための裁断機かけるには本を薄くする必要があるのです。つまり、1冊の本をいくつかに分けて、それぞれ順番に裁断するわけです。
 文庫本や新書本は分冊しやすいのですが、けっこう力がいる作業です。そのため、100円ショップで売っているようなカッターだと手が痛くなる(ということはそのうち嫌になって長続きしない)ので、大きめのカッター(ホームセンターで500円くらいで売ってます)を用意したほうがいいと思います。

2.裁断機
 分冊した本の背表紙を裁断するために必要です。本は、背表紙のところでのり付けされているので、これをカットすることで1枚ずつばらばらになり、スキャナーに通すことができるようになります。
 裁断機には家庭用から業務用までさまざまな種類があり、値段が高いほど一度に裁断できるページ数が増えることになります。私の場合、とにかく安くあげるということから、ナカバヤシの「ロータリーカッターA4」という機種(ホームセンターで1980円)を購入しました。文庫本くらいの紙の厚さなら、一度に50ページくらいは裁断することができ、充分満足しています。

3.ドキュメントスキャナー
 私の場合、キャノンのDR-150という製品を使っています。2万円台の後半で購入しました。上位機種に比べると読み取り速度は若干遅いのですが、かえってこれくらいのスピードのほうが、後で述べる原稿送りミスを監視するにはちょうどいいようです。
 DR-150のすぐれた点は、読み取った文書をPDF化する際に文字情報を付加するOCR機能が圧倒的に早いというところです。読み取りの終了とほとんど同時にOCR情報の付加も終わってしまうので待ち時間がありません。ちなみに、付加されたOCR情報の精度を確認するため、パソコンでPDF化された文書を開き検索をかけてみました。(「脳はなにかと言い訳する」池谷裕二 新潮文庫。興味のある人はお近くの書店でお買い求めください。)


書籍の電子化のポイント_c0136904_11472043.jpg



「増殖能力」という単語で検索をかけてみると・・・


書籍の電子化のポイント_c0136904_11475950.jpg


 
 瞬時にヒットしました。OCR機能の精度が高いことがわかります。
 ちなみに、パソコンでPDF文書を読むぶんには、このように縦書き文書の文字列検索も可能なのですが、iPhone用のPDF文書閲覧アプリで縦書き検索のできるものは、残念ながら今のところないようです。

4.PDF編集ソフト
 PDF文書に「しおり」を作成するために必要です。ソフトによってはアウトラインと呼ぶものもあるようです。しおりを設定すると、しおりの一覧からそのページにジャンプすることができます。Webブラウザの「お気に入り」のような機能だと思っていただければよいでしょう。
 下の写真は、GoodReader というiPhoneのアプリで「しおり」を活用しているところです。(「街場の現代思想」内田樹 文書文庫より。なお、著作権の関係で本文はぼかしをかけています。内容を知りたいという方は、お近くの書店でお買い求めください。)一覧から行きたいところをタップする(この場合は「文化資本の逆説」)と右の写真の画面に切り替わります。


書籍の電子化のポイント_c0136904_1150968.jpg



 PDF編集ソフトとして、私の場合はPDFの本家であるAdobe Acrobat を使っていますが、もっと廉価なソフトもあります。ジャストシステムの「PDF 高度編集」などは安いうえにアクロバットとほぼ同程度の機能があるのでお買い得といえるでしょう。
 ただし、「しおりなんかいらないよ」という人もいると思います(マンガをPDF化するときにはたしかに不用でしょうね)。そういう方にはPDF編集ソフトは必要ありません。

【作業のポイント】
1.背表紙の裁断幅は大胆に
 本は背表紙のところでのり付けされているので、この部分をカットすると1枚ずつばらばらにすることができます。そうやってドキュメントスキャナーで読み込むわけですが、背表紙の裁断幅が狭いとのりづけされた部分が残ってしまうことがあります。スキャナーで読み込む際に紙詰まりやページ飛びなどの原因となるので、裁断幅は大胆にとります。 ただし、スキャナーで読取る祭には、余白(ページ端から内側に向かって数ミリ幅の領域。この部分は読込みされません。)が設けられます。裁断幅が広すぎると、この余白部分に文字が近づくことになり、できあがったものを画面表示させると、文字領域がページ端すれすれになってしまいます。
 文庫本を裁断するときは、はがきの幅よりも心持ち広めのところでガイドレールを設定するとよいようです。なお、裁断機にはガイドレールは必ずついていますし、用紙の大きさを示すマーカーも設けられているので、困ることはありません。

2.スキャナーに通すのは中表紙から
 本のページは、中表紙を1ページとして順に割り振りされています。読込み作業中、それまで読込んだページ数がパソコンの画面に表示されます。それと印字されているページ数とを比較すれば、ページ飛びがないことを確認することができます。それまでに読込んだ紙のページ数が204で、画面のページ数が202となっていれば、どこかで2枚いっぺんに読み込んでしまい、そのためにページ飛びが発生したことがわかります。これに気づかないで作業を終えてしまうと、せっかく電子化した書籍に落丁が生じてしまいます。

3.スキャナーの解像度設定は300dpi は必要です
 初期設定は200dpiとなっているようですが、これだとできあがりがなんとなくぼやけた感じになってしまいます。iPhoneなどの高精細化された液晶画面も、これでは宝の持ち腐れになります。
 また、OCR情報を付加する場合も、解像度200dpiでは誤認識する怖れもあるので、300dpiに設定しておきましょう。それ以上の解像度にしても、読取り速度が遅くなりPDF化されたときのファイルサイズが大きくなるだけです。300dpiであれば、人間の目には充分美しく見えます。
 先ほどのiPhoneの画面写真は300dpiで作成したPDFファイルを表示させたものです。著作権に配慮して、本文はぼかしていますが見出しの部分をご覧いただければ、充分実用に耐える品質であることがおわかりいただけると思います。

4.スキャナーのカラーモードは白黒モードで
 写真やイラストなどがない本文であれば、スキャナーで読込むのは白黒モードで充分です。カラーモードにすると読込み時間が遅くなるだけでなく、ファイルサイズも大きくなります。
 なお、ドキュメントスキャナーにセットできる原稿の枚数は文庫本の場合50ページくらいです。原稿がなくなれば新たにセットして引き続き読込みを行うことが可能です。

5.白黒モードとカラーモードを混在させるには
 写真やイラストが印刷されているページを白黒モードで読込むと、黒く潰れてしまい見るに堪えなくなってしまいます。このため、写真やイラストのページだけは、本文とは別個に、カラーモード(白黒写真の場合はグレーモード)で読込む必要があります。この場合、1ページ1ファイル(両面読取りの場合は1枚1ファイル)にしておきます。
 高級機には原稿カラー自動判別機能がついているものもあるようですが、私が使っているDR-150はそうではないので、カラー原稿と白黒原稿を分けてスキャンしなければなりません。

1)あらかじめ写真やイラストが印刷されているページを抜き取っておき、白黒モードで読取ります。
2)写真やイラストを1ページずつ(両面読み取りの場合は1枚ずつ)スキャンし、1つの独立したPDFファイルとして保存します。
3)PDF編集ソフトで白黒文書ファイルを開き、カラーページのPDFファイルをひとつずつ途中に挿入していきます。
4)すべてのカラーページの挿入が終わったら、改めてファイルを保存します。

6.読込みミスの対策
 紙がくっついていたり、のり付け部分のカットがきちんとされていなかったりすると、スキャナーで読み込む際にミスが発生します。
 この場合、最初からやり直しというのも大変です。
 DR-150にはあらかじめ設定したページ数ごとにPDFファイルを作成していくという機能があるので、これを使えば途中で読み込みミスが発生した場合でも被害を最小限に抑えることができるようになります。
 その代わり、1冊の本に対し複数のPDFファイルを分割して作成することになりますが、PDF編集ソフトを使えば複数のファイルをひとつにまとめることが可能です。

7.電子書籍を携帯デバイスに送る
 電子書籍はファイルサイズが大きいのでメールに添付して携帯デバイスに送ることができません。USBケーブルで直接取り込むかネット経由で取り込むかのどちらかとなります。

1)USBケーブルでパソコンから直接取り込む
 iPhoneの場合、GoodReader for iPhone というアプリを入れていれば、iTuneseを使ってパソコンからUSBケーブルでデータを取り込むことができます。
 下の写真はその画面です。iTunese の中央上の方にある「App」をクリックしてから、画面を下の方にスクロールするとこの画面となります。ここでGoodReader for iPhonを選択してから、「追加」ボタンをクリックするとエクスプローラが開くので、iPhoneに取り込みたいPDFファイルを選択します。
 この方法だと取り込み速度が非常に速いのが特徴です。


書籍の電子化のポイント_c0136904_12123982.jpg




2)ネット経由でパソコンから取り込む
 Evernote や DropBox のようなサービスを使えば、ネット経由でパソコンから電子書籍を取り込むことができます。
 DropBoxは無料で2GBまでの容量が使えるのでとても便利です。使い方は、まずパソコンとiPhoneの両方にDropBoxをインストールします。
 次に、パソコンの中にMy DropBox というフォルダができるので、iPhoneに送りたいファイルをその中に入れるだけです。なお、My DropBoxフォルダの中には自分でフォルダを作成することができ、その変更は自動的にiPhoneの側にも反映されます。つまり、パソコン側で行ったファイル管理がそのままiPhoneにも適用されるのです。逆にiPhoneのDropBoxでファイルを削除すると、パソコン側でもファイルが削除されます。

8.携帯デバイスで電子書籍を閲覧するアプリには気を遣いましょう
 私の場合、iPhoneで広く使われているGoodReader for iPhoneというアプリを使っています。有料(350円)ですが、PDF編集ソフトで作成した「しおり」をつかってジャンプすることができる(さきほどのiPhoneの画面はGoodReaderのものです)うえに、縦書きPDF文書を横書き表示に変更させることができ、さらに自動スクロールもできるという非常にすぐれたアプリです。
 iPhoneでは縦書き1ページが1画面に表示されるので、正直いって私のような年寄りには見づらいときがあります。ところが、横書き表示機能を用いると、文章のレイアウトは崩れてしまいますが、文字が大きくなって読みやすくなるのです。しかも自動スクロール機能を使えば、ゆっくり下にスクロールしてくれる(映画やドラマのエンド・クレジットのイメージ)ので落ち着いて読むことができます。(ただしページの切り替えは手動です。)
 もちろんPDF以外のファイルを表示させることもできます。難点をあげれば、縦書き文書の文字列検索ができないことくらいでしょうか。



 長々と書いてきましたが、これから書籍の電子化に取り組んでみようかというかたの、多少でも参考になれば幸いです。
by T_am | 2011-01-09 11:53 | iPhoneを使いこなすために

by T_am