« 肯定できる体罰があるとすれば | トップページ | 力学構造は同じ »

2013年1月13日 (日)

自炊の実験

 Testpre

ミクシーの日記の転載*
ちょっと前に
.
壊れたかも。。。
線を繋ぎ直したらオッケーになった。。。.
.
っと。
書いてたスキャナ。
当時も
. 
線を繋ぎ直したので治ったってのは、勘違いっぽいけど。。。っと、
思ってはいたけど、
やっぱし、壊れた。

. 
コレ、
3万弱だったモノ。9000F
. 
でも1年以上たってる。

ケーブルの口が犯人だとは思うけど、

コレを修理したとしたら、
おそらく1万はかかる。
. 
新しいのをみると。。。
解像度が半分のが、8000円
でも、バッテリはUSBで取れる。
A4

. 

イロイロ実験してみた。
. 
まず、データサイズ
. 
改めて実験したくないので、まあ、
アバウトに。
. 

機材は、
キャノンの 
canoscan Lide210

購入価格として9000円弱位だったか。
A4
. 

OCRもついてる。

. 
さて、
でもって、夕べは何冊か図書館で本を借りて来て、
ざっと読みながら、重要そうな場所をスキャン。
以下、どれもA4サイズ
. 

. 


患者の権利と医療の安全.pdf 32.9MB 103page 150dpiグレイスケール
患者の権利と医療の安全ss.pdf 30.1MB 103page 150dpiグレイスケール
患者の権利と医療の安全s.pdf 25.9MB 103page 150dpiグレイスケール
. 

患者の声を医療に生か.pdf 1.1MB 10page 100dpiグレイスケール

医療人間工学.pdf 1.7MB 11page 100dpi グレイスケール

患者不満とリスクマネジメント.pdf 26.3MB 25page 150dpi カラー


testpre.pdf 401kb

. 

って、ざっと、虎居あんど鰓 しながらなんで、イロイロあったけど。
コクリコ坂と、光る目を見ながら、ボチボチ
慣れれば、きっと100ページ30分かも。。
. 

上は読みながらのピックアップなので、時間はかかった。
コピーを取ることができるので、結果的に、後でしっかり読もうというのと、
コレはくだらない。。。って思うのと、イロイロあるわけで、
でも、上の4冊のうち、1冊は完全にハズレ。
もう1冊は、中の一部だけが必要(友人が書いてるんで、他はどんなのか分かってる)
もう1冊はナナメ読みでかなり分かったんで、コレで返して良いかな。。。ってレベルのもの。最後の1冊は、コレはしっかり読もう。というものだった。
なので、4冊の本を、しっかり読むを入れて2日で処理できるとなると、
かなり合理的。
. 
今回、修論のテーマになってる本が書架として、二つ分位なので、まあ楽勝かな。
この方法なら、全部読んでも1ヶ月かもしれない。
. 

さて、
. 
最初は、カラーで取ってしまった。

. 
患者不満とリスクマネジメント.pdf 26.3MB 25page 150dpi カラー
. 
25ページで150で 26MB うん。なかなか重い。
(こういうデータサイズは文字やデザイんによって違うので注意)
. 
次に、
患者の権利と医療の安全.pdf 32.9MB 103page 150dpiグレイスケール
. 
グレースケールにすると、32MB
でも、コレ、見開き 103ページなので、本当のページにすると206ページ
本1冊32MBならイイ。
. 
1ページざっと 300kbかな。
. 

で、コレを
. 
アクロバット プロフェッショナルで サイズダウンすると。。。25.8MB
プレビューで 再保存すると、30MB
. 
以前も書いたけど、こういう純粋な画像系?のPDFだと、プレビューはあまり小さくしてくれない。

. 
で、次は、
100 dpiと解像度を下げても良いのではと、
100dpiにしてみる。

患者の声を医療に生か.pdf 1.1MB 10page 100dpiグレイスケール
. 
医療人間工学.pdf 1.7MB 11page 100dpi グレイスケール
. 
こんな感じ。
概ね、
. 
1ページ 150kb ってとこか。
. 
もちろん、スキャン速度は解像度が小さいほど、早い気がするから、それで良いかも。
普通の本の本文は遜色無い。
多少あるとすれば、論文なんかの場合、注釈のコマカイ字が、書体によってはどうかな。っていうのと、データのテーブルとか、グラフ、写真はどうかな。。。って所はある。
(でも、まあ、使える範囲かも。だって、コピーと同じレベルだと思えばいい)

. 

さて、
コレをテキスト化してみる。
. 
まず、その中の 適当な1ページ。
表題があって、文字が固まってる標準的な部分。
. 

見本の画像をアップした。
コレはJPEG
解像度は150

. 
PDFなので、近頃のアクロバットでは、コレをテキストとして、読んでくれる。
コレを ワードに貼付けてみる。
誤字の様子は下記の通り
. 


]36 第皿部 医療事故からの克;Rを日指すために
3 5 Treatment inluryの問題点
――因果関係の要件と無過失スキーム貫徹の困難さ
しかし,Tlca●■lcnt lnJuryという概念は 常に息者側に満足な結果をもたら
すとは限らない すなわち,Treat llellt lnluryといえるためには, まず,人身
侵害がTreatnlcntによつて生じたこと(因果関係)が必要となる しかし,人
身侵害がTreat nentによつて生したのか,それとも他の原因によつて生じた
のかを容易に認定することができない場合は少なくないことが予想される 例
えば,事故71償法は,Tleatnlcnt lnJuryとはいえない人身侵害として,患者の
潜在的な健康状態に,全面的またはかなりの程度,起因する人身侵害は含まれ
ないとしている19が,たCがこれを理由に補償をIFんだ場合に,患者側が最
終Hlには民事.lF訟を提起して,自ら因果関係を立証する必要に迫られる
しかも,Trcatnlent lllluryが本当に無過失スキームの中で理解しうる
. 

コレを、
スキャナについてる OCR 読み取り革命 とかナントカにやらせてみる

. 
336

第m部医療事故からの克服を目指すために

3,5 Treatment lnjuryの問題点
   ‥因果関係の要件と無過失スキーム貫徹の困難さ
 しかし,Treatment lnjury という概念は、常に患者側に満足な結果をもたら
すとは限らない.すなわち,Treatment lnjury といえるためには,まず,人身
侵害がTreatmentによって生じたこと(因果関係)が必要となる.しかし,人
身侵害がTreatmentによって生じたのか,それとも他の原因によって生じた
のかを容易に認定することができない場合は少なくないことが予想される.例
えば,事故補償法は,Treatment lnjury とはいえない人身侵害として,患者の
潜在的な健康状態に,全面的またはかなりの程度,起因する人身侵害は含まれ
ないとしている19’が,ACCがこれを理由に補償を拒んだ場合に,患者側か最
終的には民事訴訟を提起して、自ら因果関係を立証する必要に迫られる.
. 
おおっt。。。そこそこ賢い。
. 
もひとつ、トライ。
こちらは、この間購入した、
Mac用の
. 
OCR コンバーター プロ
っての。確か 1700円とかだったソフト
こちらは、PDFからスキャンしてくれるので、ページでもやってくれる。
. 

336

第m部医療事故からの克服を目指すために

3,5 Treatment lnjuryの問題点
   ‥因果関係の要件と無過失スキーム貫徹の困難さ
 しかし,Treatment lnjury という概念は、常に患者側に満足な結果をもたら
すとは限らない.すなわち,Treatment lnjury といえるためには,まず,人身
侵害がTreatmentによって生じたこと(因果関係)が必要となる.しかし,人
身侵害がTreatmentによって生じたのか,それとも他の原因によって生じた
のかを容易に認定することができない場合は少なくないことが予想される.例
えば,事故補償法は,Treatment lnjury とはいえない人身侵害として,患者の
潜在的な健康状態に,全面的またはかなりの程度,起因する人身侵害は含まれ
ないとしている19’が,ACCがこれを理由に補償を拒んだ場合に,患者側か最
終的には民事訴訟を提起して、自ら因果関係を立証する必要に迫られる.

. 

. 

うん。
ニホンゴ、ダメダメとは思ってたけど、
結構できてる。
. 
すごい。。。
. 

さて、このMacのお安いOCRでは、
200ページ以上のPDFを
即座に前ページテキスト化することができる。
とは言うものの、
上のサンプルのように、しっかり固まった部分だけをやるのとちがって、
余白、そのほか、めちゃくちゃ。
なので、コレで1冊読もうとなると、かなりの忍耐がいる。
. 
が、データサイズとしては、
483kbとなる。
. 
しかも、
「検索」ができる。
. 



結論
OCRの100dpiはトライしていないが、
150でやってもデータサイズとしてはそれほど無茶なモノにならない。
将来、二次利用などを考えると、(特に図など)
150で取り込んでおく方が良いかもしれない。
. 
まず、データをマシン内でしっかり読みながら、引用したい部分を
スクリーンショットなどで切り取って、ピックアップ。
それをまとめてOCRにして、
論文には貼付ける。
. 
その一方で、
資料集として、
すべてをOCRでテキスト化して、検索できるようにしておくのも一興。
というか、複雑にいろんな資料を使う人には、便利かも。

 

|

« 肯定できる体罰があるとすれば | トップページ | 力学構造は同じ »

デザイン」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.f.cocolog-nifty.com/t/trackback/1210811/48726082

この記事へのトラックバック一覧です: 自炊の実験:

« 肯定できる体罰があるとすれば | トップページ | 力学構造は同じ »