2010年11月28日日曜日

クイズ「る」

有居売得折
刈切来蹴凝
去知刷競剃
足散釣照取
成煮塗寝乗
貼干降経掘
放見蒸減盛
遣□揺□寄
□□□□□

2010年11月23日火曜日

オンラインストレージあれこれ

最近では大半の文書はオンラインストレージに保管するようにしている。このオンラインストレージという言葉は、かならずしも十分な意味を伝えない。まず、オンラインでしか使えない印象を与える。確かにそのようなものもある。しかし、オフラインで使えるものもある。ここではクラウド上にデータを保存できるサービスの総称としてオンラインストレージという言葉を使う。もう少しクラウドが身近になればクラウドストレージとか、単にクラウドでも通じるようになるだろう。
一番よく使っているのはDropBoxだ。これは正確にはフォルダ同期のシステムだ。ローカルには格納場所が必要なので、新たに要領を追加する目的では使えない。無料版は2GBだ。なぜ、このような少ない容量のサービスを使っているかというと便利かつ十分だからだ。便利というのは、すでに長く使っていてなじんでいるからという意味もあるが、さまざまな機種で使えるということも大きい。Windows, Macはもちろん、LinuxやiPhone, iPadでも使える。特に、iPhoneとWindowsの間でデータの送受信ができるところがあり難い。つまり、ストレージの中でもフロントエンドに該当するサービスとして重宝なのだ。2GBという容量は確かに小さく不満がないわけではない。しかし、ワーキングセットとしてならば2GBで十分だ。仕事に応じて2GBを切り替えればよい。
最近使い始めたのがSugarSyncだ。こちらはDropBoxに様々な機能と容量が追加されている。まず任意のフォルダを同期することができる。DropBoxはMy DropBoxしか同期してくれない。しかし、個人的にはフォルダは1つにまとめたいので、この機能は使っていない。もしかしたら、今後は役に立つかもしれない。容量は5GBだ。この容量もローカルに必要だ。2GBと5GBの差は大きい。なぜなら5GBだとDVDのイメージなども含めることができるからだ。容量の大きなファイルをゆっくりだが、空いた時間でコピーしてくれるのは効率がよい。
SugarSyncと類似のシステムにソラ箱がある。これを容量が5GBだ。3つ合わせると12GBになる。私のPCのSSDは64GBしかないので、ワーキングセットとしては十分すぎる。ただし、今のところソラ箱は使っていない。なぜかWindowsクライアントが動かないからだ。Javaをインストールしており、PATHも通しているのに、JavaのDLLがないと警告される。Eclipseをはじめ、その他のJavaプログラムは何の問題もなく動作しているのにだ。また、Windowsクライアントが常駐型でないので、いつの間にか同期するという使い方はできなそうだ。よって、ソラ箱はUSBメモリか、あるいはSDカードに入れておいた方がよいかもしれない。ちなみに私は常に16GBのSDメモリを指しっぱなしにしている。これがメインのワーキングセットだ。
最後にSkyDriveだ。これはローカルに保存しない純粋なオンラインだけのストレージだ。SDExplorerで普通のフォルダのように使っている。しかし、ファイルサイズが50MBしか対応していないので、どのようなファイルでも保存できるわけではない。かなり厳しい制約なのでバックアップ的な役割になっている。やはり少しでも制約があると、便利に使うというわけにはいかない。

スキャンミスのチェック

だいぶ自炊になれてしまった。
しかし、そうなると、作業時間の中で手間取るポイントが前とはかなり違ってくる。
前は裁断に手間取っていたが、これは道具を使うことで非常に簡単になった。実際、裁断時間よりスキャン時間の方がはるかに長くかかる。
しかし、単純な裁断だけでは不十分だ。実際には裁断した後、きちんと各ページが分離しているかどうかチェックする必要がある。これを怠ると読み取りエラーが起きるだけでなく、紙を破いてしまうこともある。そうなるととりかえしがつかない。
この裁断の確認が手間だ。
もう1つはスキャンミスのチェックだ。紙送り式では一度に二枚以上の紙を送ることがある。この機械的なエラーは決してなくならない。どれだけエラーが少ないかは機種に依存し、カタログスペックには現れない。個人的な経験ではScanSnapの方が、DR-150よりエラーが少ない。しかし、ScanSnapでもエラーが起きないわけではない。
そこで、ページ数でチェックを行う。目次とイメージ数との差が最初から最後まで一貫していれば一応全ページスキャンできたものと判断する。しかし、この方法とて完ぺきではない。ページ番号のない個所をチェックできていないからだ。目次前と解説の後だ。とくに後者には参考文献などの重要な情報も含まれるので、見逃さないようにしなければならない。また、コミックのたぐいはほとんどページ番号がつけられていない。あるいはページ番号を隠すように絵が描かれている。よって、ページ数のチェックは難しい。

これからのメール管理

すでに個人ではGmailを使っている人は多い。
会社の中にはGoogle Appsを使っている会社も増えている。
うちの学校ではGoogle Apps Educationを使っているが、これは個人版より機能が限定されていて使いにくい。
もしもGoogle AppsがEducation版程度の機能なら使う必要はない。むしろかえって使いにくくなる。
実際にはEducation版より高機能ではあるのだが、しかし無料版より多くの機能があるとは思えない。広告などが消え、管理が統制できるくらいだ。
それならば、メンバーに個人版としてアカウントを作成してもらい、そのアドレスを登録した方がよい。一切のメール機能を無料版に委託してしまう。このような方法もこれからの時代には検討していく必要がある。

2010年11月10日水曜日

白紙ページの挿入

ScanSnapなど高度なスキャナでは、白紙ページを認識して自動的に削除してくれる機能がある。
これは不要なページを削除してデータを圧縮する効果があり、重宝する。
しかし、これを使うとページ数が一定でなくなり、スキャンのページ抜けを簡単には検証できなくなる。
そこで、圧縮機能はそのままでページ数を一定にするために、直前のページと同一サイズの白紙ページを挿入してほしいと思う。
生成された博士ページは非常にコンパクトなので、ほとんど容量は増えない。しかし、それがあることの意味は大きい。

スキャン本の検索

電子書籍の流通が一般的になるまでは、しばらく自炊生活が続くだろう。
このようなときスキャン本の検索機能がほしくなる。
CDをリッピングしても、そのデータから曲名が検索できる。
これは元がデジタルデータなのでさほど困難ではない。音楽の場合、データでも文字がないため、それを補う必要があるため、このようなサービスが発展している。
電子書籍なら最初から検索出来て当たり前だ。
しかし、デジタルでもスキャンした本には文字情報がなく、検索のためには精度の低いOCRをしなければならない。この手間は大きい。
しかし、ソーシャルとして考えれば、誰かがすでにOCRしている可能性がある。それを検索するために、表示のイメージ同士でマッチングを行うことが考えられる。
これにはイメージ検索が使える。
このようなデータの共有には2つの意味がある。1つは無駄な手間と重複する情報量の削減だ。もう1つはコンテンツ保護だ。正当な所有者であることをイメージで示すわけだ。もちろん、これは抜本的な方法ではない。抜本的な保護のためには最初から電子化してなければならない。

クリアポケット

いわゆる自炊で役立つのがクリアポケットだ。
ポケットタイプのクリアファイルのことだ。
なるべく透明度の高いものがよい。
何に使うかといえば、カバーなどを折りたたんでスキャンするのに役立つ。
本、特に文庫はカバーがなければそっけない表紙しかない。
だから、ぜひともカバーも保存しておきたいのだが、カバーを伸ばしてスキャンすると用紙サイズの上限を超えてしまう。
素朴な疑問だが、シートフィーダ方式のスキャナになぜ縦幅の上限があるのか理解に苦しむ。任意サイズを許しても構わないと思うのだが、実際にはA4くらいで打ち切られる。読み取ったところまででもデータが残ればよいが、たいていはエラーとして全体が破棄される。つまり不定形の長すぎるカバーはスキャンできないのだ。
このようなとき折りたたんでA4以下のサイズにすればスキャンできる。しかし、ローラーが折りたたんだ個所を無理に伸ばしたりしてうまくスキャンできないことが非常に多い。
そこで、クリアポケットの出番となる。折りたたんだままクリアポケットに入れておけばうまく読み取ってくれる。
しかし、これが通用するスキャナとそうでないスキャナがある。
DR-150ではうまくいく。しかし、ScanSnapではうまくいかない。紙送り機構の差でポケットを送れないのだ。
ScanSnapの紙送りは、違っているかもしれないが、上下逆方向の摩擦を与えるようで、ポケットが上下で逆方向へ動こうとする。これは確実に1枚ずつ紙送りするにはよいしくみだ。実際、ScanSnapではDR-150より確実に紙送りのエラーが少ない。しかし、その結果、ポケットを紙送りすることができない。
ちなみに、クリアポケットは10枚入りが100円ショップで売られている。