電子校正ことはじめ、あるいは半自動校正の妄想的構想。

だんだん「似非・日刊FeZn」が辛くなってきました。ははは。今日はドラフト状態の自分用メモを殆どそのまま掲載。
ドラフトと言っても発砲いや発泡するアレではなく、横滑りするアレでもなく(それはドリフト)。
ところで一件校了したものがあり、明日というか今日2/8[金]はPAGE2008を見学しに行けそうな気が。


(自分宛の備忘録)

///////////////////////////////////////////////

 電子校正ことはじめ。
 「初校紙や再校紙などのデータをテキストデータ化して、
  それを検索し、校正補助ツールする。」

■0■
 CUIプログラム「xdoc2txt」を用意しておく。
http://www31.ocn.ne.jp/~h_ishida/xdoc2txt.html

■1■
 校正紙の元データを用意する。(PDF、Wordなど)
 ※PDFは、スキャニングして作った画像PDFはダメ。
  組版ソフトから作った、文字列が選択できるPDF
   =文字が文字として“生きている”PDFファイルのみ。

■2■
 校正紙のPDFファイルが多数のデータに分かれている場合、
 全ページ分のPDFファイルを一箇所にまとめておく。
 (コピーする、など。)
 そして、以下のコマンドを実行。

 あるいは、例によってバッチファイルとして保存し、
 ダブルクリックで起動できるようにするのでもOK。

◆一つのテキストファイルに結合する◆
  xdoc2txt *.pdf > output.txt

◆複数ファイルのままにする◆
  xdoc2txt -f *.pdf



■3■
 出来上がった output.txt のファイル内を検索する。
 複数ファイルのままにした場合、grep(グレップ)が便利。

 sedスクリプトで、よく出てくる「注意すべき語句」を洗い出すのも便利か
も。

 ◆この方法の長所と短所◆
 ・使い慣れたテキストエディタetc.で、複雑な検索ができる。
  (正規表現など)
  Word文書やPDFのまま扱うよりも、軽量快速。
 ・ノンブルが無い場合……若干不便。前後にある文章などのみから類推する
必要がある。
  ※ノンブルの数字列も抽出できるなら、その数字を使って、該当箇所を調
べることが可能。


◆◆他の方法を採る◆◆

・元から1ファイルになっている場合
 →PDFファイルを直接、Adobe Reader などで開いてファイル内検索

・特定の文字列が「どのファイルに有るか」が分かれば良い、という場合
 →Windows標準の検索機能で、PDFファイルをそのまま検索。
  →どのファイルに有るか、は分かる。
  →正規表現は使えない。

・もっと凄いツールを使う。
 →PDFを串刺し検索できる何か。
 (いや、どういうのがあるか知らないけれど。)
[PR]
by fezn | 2008-02-08 00:22 | Script


メディアの海の片隅で、ぷかぷかと漂っているクラゲ。文字とか組版とか、勉強中。


by fezn

プロフィールを見る
画像一覧

S M T W T F S
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31

最新の記事

そろそろBlog再開しますかね
at 2015-01-31 04:32
ようこそFeZn/Bookm..
at 2014-12-31 23:59
スクープ! QWERTY俗説..
at 2013-06-20 01:56
更新してなかった月日に関する諸々
at 2013-06-16 13:24
「文字とコンピュータ」第一回..
at 2011-10-20 15:28
なんとなく作業用メモ……その..
at 2011-07-27 19:35
私家版・「様々な訓読み」(2..
at 2011-07-25 05:43
常用漢字表・付表=熟字訓(2..
at 2011-07-25 04:14
可動SPICA募集中(亮月製..
at 2010-10-08 20:56
(記事移転)「和文フォントの..
at 2010-09-18 21:22
(記事移転)先にアリガトウと..
at 2010-09-18 21:06
(記事移転)Excel で重..
at 2010-09-18 21:01
(記事移転)【memo】DT..
at 2010-09-18 20:57
(記事移転)『「成り立ち」「..
at 2010-09-18 20:47
(記事移転)グリフ主義そして疑問
at 2010-09-18 20:30

カテゴリ

全体
Bookmark
Typeface
DTP
EDICOLOR
Script
Source
Stationary
Wandering
Books
TIBF
未分類

検索

ライフログ


古代史の謎は「海路」で解ける (PHP新書)


[図解]偏差値41から東大に合格した人の「記憶術」「読書術」「時間術」


[図解]武士道 逆境に負けない不屈の精神、何事にも動じない心を鍛える


[証言録]海軍反省会 7


文字の組み方―組版/見てわかる新常識


文字の骨組み―字体/甲骨文から常用漢字まで


欧文組版 組版の基礎とマナー (タイポグラフィの基本BOOK)


日本語組版の考え方


文字をつくる―9人の書体デザイナー


欧文書体 2 定番書体と演出法 (タイポグラフィの基本BOOK)


欧文書体―その背景と使い方


シーリングワックスの本―基本の使い方からアレンジ法まで


文字のデザイン・書体のフシギ 神戸芸術工科大学レクチャーブックス…2


アイデアのつくり方


印刷史/タイポグラフィの視軸―府川充男電子聚珍版


フォントブック[和文基本書体編] (+DESIGNING) (+DESIGNING)


「印刷雑誌」とその時代―実況・印刷の近現代史

最新のトラックバック

私家版・「様々な訓読み」..
from FeZn/Bookmark
[文字][event]2..
from FeZn/Journal
イラレ9やインデザ2の、..
from FeZn/Bookmark
「アドビのアプリがなにや..
from FeZn/Bookmark
竹村真一『明朝体の歴史』..
from FeZn/Bookmark
写研書体と機械についての..
from FeZn/Bookmark

以前の記事

2015年 01月
2014年 12月
2013年 06月
2011年 10月
2011年 07月
2010年 10月
2010年 09月
2010年 03月
2010年 02月
2010年 01月
2009年 12月
2009年 10月
2009年 09月
2009年 08月
2009年 07月
2009年 06月
2009年 03月
2009年 02月
2009年 01月
2008年 12月
2008年 09月
2008年 08月
2008年 07月
2008年 04月
2008年 02月
2008年 01月
2007年 12月
2007年 07月
2007年 04月
2007年 02月
2007年 01月
2006年 12月
2006年 11月
2006年 10月
2006年 09月
2006年 08月
2006年 07月
2006年 06月
2006年 05月
2006年 04月
2006年 03月
2006年 02月
2006年 01月
2005年 12月
2005年 11月
2005年 10月
2005年 09月
2005年 08月
2005年 07月
2005年 06月
2005年 05月
2005年 04月
2005年 03月
2005年 02月
2005年 01月
2004年 12月
2004年 11月

Anchor

その他のジャンル

ファン

記事ランキング

ブログジャンル

画像一覧