さくいん生成
今日のお仕事の1つ。さくいん作成。ただし初回ではなくて、続き。作業時間よりこの説明書く時間のほうがかかってる(汗)。
1枚目を半分手作業でレイアウトして、同様のページが何度も何度も出てくるし、テキストデータもあるというので、最初に作ったときにスペックとか文字枠とかグループに名前をきっちりつけておいたので、それを再利用する方向で。
スクリプト遊び。原稿をタグ付けしながら、それを流し込んでしまうのだ。
「自動タグ付け~配置まで.bat」
まあそこまでやらなくても、タグテキストが生成できればいいですわな。
「option.txt」はこれだけ書くだけ。まあ、ダイアログを出す形で自動プリントアウトまでやってもいいかもしれないけれど、手動調整が待ってるので。
もと原稿はこんなかんじ。
「sakuin.txt」
縦組に使うので、連文字処理したいですな。二桁以上の数字には。連文字(連数字)処理。別名「縦中横」。
(現場にある「数字は1桁全角で2桁以上半角」って話については、また今度)
上で参照している、タグ付けのルールを書いたsedスクリプトファイルは以下の通り。
「tagrule2.sed」
二桁以上の数字には、連文字タグ<RMJ></RMJ>で囲む。
文頭(最初の行)に<tag>、最後に</tag>は必須。<tb name="さくいん本文">は、流し込む先のテキストボックスを指定(指名)するわけで、マウスでポイントしてCommand+Iで取り込むなら不要(だと思う)。
「あ・か・さ・た・な……」については、「行頭かつ、行末」なので簡単に抽出。予め用意した、画像とか文字枠とかで構成したグループ(あ、か、さ……なる名前がつけてある)をインラインオブジェクトとして読み込み、その後ろにスペック(スタイル)適用して、タブで色つきの中線を引く。
(タブにつくのが色つきの中線だってのはスペックのほうで指定してある。)
できあがったのがこちら。(ExciteBlogでタブが見えぬので、「―――」に変えてある。)
「t-sakuin.txt」
ちゃんと「返り血」のところとかの、1桁の数字は連文字タグは入っていないからOK。
このsedスクリプトだと、三点リーダを含む項目名も変換されてしまうので問題。『……絶句。』とか。最初にもらったのはタブが入っていたんだけれど。てぇことは原稿をタブ区切りで貰えば良いのか!
いや、まあ「『なんらかの文字』『リーダーいくつか』『数字』の順で並んでいるとき」って条件にすればいいのかなぁ。
ところでEDICOLOR6.0のマニュアルには、<INLINE>命令が載ってないです。5.03で追加されたタグで、5から6にマニュアルを改訂するときに載せ忘れたそうな。げふ。公式サイトのupdaterのページで、変更点のページをプリントしてマニュアルに貼りませう。
組版結果のJPG画像を貼っていなかったので、次のエントリに。
http://fezn.exblog.jp/3320465/
1枚目を半分手作業でレイアウトして、同様のページが何度も何度も出てくるし、テキストデータもあるというので、最初に作ったときにスペックとか文字枠とかグループに名前をきっちりつけておいたので、それを再利用する方向で。
スクリプト遊び。原稿をタグ付けしながら、それを流し込んでしまうのだ。
「自動タグ付け~配置まで.bat」
sed -f tagrule2.sed sakuin.txt > t-sakuin.txt
"C:\Program Files\EDICOL6\Edicol6.exe" さくいん.ec6 -e option.txt
まあそこまでやらなくても、タグテキストが生成できればいいですわな。
「option.txt」はこれだけ書くだけ。まあ、ダイアログを出す形で自動プリントアウトまでやってもいいかもしれないけれど、手動調整が待ってるので。
<TXTIN PATH="t-sakuin.txt">
もと原稿はこんなかんじ。
「sakuin.txt」
あ
アスベスト………………86
あんごう…………………36
意味不明…………………70
隠滅(証拠)…………52・56
エッセネ派………………36
干支ガン…………………62
エンドアの戦い…………24
置き引き…………………70
か
凱旋門…………………82
返り血…………………7
健康器具…………………24
さ
サンキスト・オレンジ……52
サンセリフ…………………20
指導! ドゴッ!………23・26
スーパーヘテロダイン無線機…………81
戦争と平和……2・19・22・44・52
ソードブレイカー…………26
た
タンバ………………………18
チョークスリーパー……20・36
縦組に使うので、連文字処理したいですな。二桁以上の数字には。連文字(連数字)処理。別名「縦中横」。
(現場にある「数字は1桁全角で2桁以上半角」って話については、また今度)
上で参照している、タグ付けのルールを書いたsedスクリプトファイルは以下の通り。
「tagrule2.sed」
s/…+/<ts name="sakuin_leader">\t<\/ts>/g
s/\([0-9][0-9]\)/<RMJ>\1<\/RMJ>/g
s/^\([あかさたなはまやらわ]\)$/<inline name="\1" copy=on> <ts name="midashi-leader">\t<\/ts>/g
1s/\(.*\)/<tag><tb name="さくいん本文">\1/g
$s/\(.*\)/\1\n<\/tb>\n<\/tag>/
二桁以上の数字には、連文字タグ<RMJ></RMJ>で囲む。
文頭(最初の行)に<tag>、最後に</tag>は必須。<tb name="さくいん本文">は、流し込む先のテキストボックスを指定(指名)するわけで、マウスでポイントしてCommand+Iで取り込むなら不要(だと思う)。
「あ・か・さ・た・な……」については、「行頭かつ、行末」なので簡単に抽出。予め用意した、画像とか文字枠とかで構成したグループ(あ、か、さ……なる名前がつけてある)をインラインオブジェクトとして読み込み、その後ろにスペック(スタイル)適用して、タブで色つきの中線を引く。
(タブにつくのが色つきの中線だってのはスペックのほうで指定してある。)
できあがったのがこちら。(ExciteBlogでタブが見えぬので、「―――」に変えてある。)
「t-sakuin.txt」
<tag><tb name="さくいん本文"><inline name="あ" copy=on> <ts name="midashi-leader">―――</ts>
アスベスト<ts name="sakuin_leader">―――</ts><RMJ>86</RMJ>
あんごう<ts name="sakuin_leader">―――</ts><RMJ>36</RMJ>
意味不明<ts name="sakuin_leader">―――</ts><RMJ>70</RMJ>
隠滅(証拠)<ts name="sakuin_leader">―――</ts><RMJ>52</RMJ>・<RMJ>56</RMJ>
エッセネ派<ts name="sakuin_leader">―――</ts><RMJ>36</RMJ>
干支ガン<ts name="sakuin_leader">―――</ts><RMJ>62</RMJ>
エンドアの戦い<ts name="sakuin_leader">―――</ts><RMJ>24</RMJ>
置き引き<ts name="sakuin_leader">―――</ts><RMJ>70</RMJ>
<inline name="か" copy=on> <ts name="midashi-leader">―――</ts>
凱旋門<ts name="sakuin_leader">―――</ts><RMJ>82</RMJ>
返り血<ts name="sakuin_leader">―――</ts>7
健康器具<ts name="sakuin_leader">―――</ts><RMJ>24</RMJ>
<inline name="さ" copy=on> <ts name="midashi-leader">―――</ts>
サンキスト・オレンジ<ts name="sakuin_leader">―――</ts><RMJ>52</RMJ>
サンセリフ<ts name="sakuin_leader">―――</ts><RMJ>20</RMJ>
指導! ドゴッ!<ts name="sakuin_leader">―――</ts><RMJ>23</RMJ>・<RMJ>26</RMJ>
スーパーヘテロダイン無線機<ts name="sakuin_leader">―――</ts><RMJ>81</RMJ>
戦争と平和<ts name="sakuin_leader">―――</ts>2・<RMJ>19</RMJ>・<RMJ>22</RMJ>・<RMJ>44</RMJ>・<RMJ>52</RMJ>
ソードブレイカー<ts name="sakuin_leader">―――</ts><RMJ>26</RMJ>
<inline name="た" copy=on> <ts name="midashi-leader">―――</ts>
タンバ<ts name="sakuin_leader">―――</ts><RMJ>18</RMJ>
チョークスリーパー<ts name="sakuin_leader">―――</ts><RMJ>20</RMJ>・<RMJ>36</RMJ>
</tb>
</tag>
ちゃんと「返り血」のところとかの、1桁の数字は連文字タグは入っていないからOK。
このsedスクリプトだと、三点リーダを含む項目名も変換されてしまうので問題。『……絶句。』とか。最初にもらったのはタブが入っていたんだけれど。てぇことは原稿をタブ区切りで貰えば良いのか!
いや、まあ「『なんらかの文字』『リーダーいくつか』『数字』の順で並んでいるとき」って条件にすればいいのかなぁ。
ところでEDICOLOR6.0のマニュアルには、<INLINE>命令が載ってないです。5.03で追加されたタグで、5から6にマニュアルを改訂するときに載せ忘れたそうな。げふ。公式サイトのupdaterのページで、変更点のページをプリントしてマニュアルに貼りませう。
組版結果のJPG画像を貼っていなかったので、次のエントリに。
http://fezn.exblog.jp/3320465/
by fezn
| 2005-08-18 00:01
| DTP
メディアの海の片隅で、ぷかぷかと漂っているクラゲ。文字とか組版とか、勉強中。
by fezn
S | M | T | W | T | F | S |
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
最新の記事
そろそろBlog再開しますかね |
at 2015-01-31 04:32 |
ようこそFeZn/Bookm.. |
at 2014-12-31 23:59 |
スクープ! QWERTY俗説.. |
at 2013-06-20 01:56 |
更新してなかった月日に関する諸々 |
at 2013-06-16 13:24 |
「文字とコンピュータ」第一回.. |
at 2011-10-20 15:28 |
なんとなく作業用メモ……その.. |
at 2011-07-27 19:35 |
私家版・「様々な訓読み」(2.. |
at 2011-07-25 05:43 |
常用漢字表・付表=熟字訓(2.. |
at 2011-07-25 04:14 |
可動SPICA募集中(亮月製.. |
at 2010-10-08 20:56 |
(記事移転)「和文フォントの.. |
at 2010-09-18 21:22 |
(記事移転)先にアリガトウと.. |
at 2010-09-18 21:06 |
(記事移転)Excel で重.. |
at 2010-09-18 21:01 |
(記事移転)【memo】DT.. |
at 2010-09-18 20:57 |
(記事移転)『「成り立ち」「.. |
at 2010-09-18 20:47 |
(記事移転)グリフ主義そして疑問 |
at 2010-09-18 20:30 |
カテゴリ
全体Bookmark
Typeface
DTP
EDICOLOR
Script
Source
Stationary
Wandering
Books
TIBF
未分類
検索
ライフログ
最新のトラックバック
以前の記事
2015年 01月2014年 12月
2013年 06月
2011年 10月
2011年 07月
2010年 10月
2010年 09月
2010年 03月
2010年 02月
2010年 01月
2009年 12月
2009年 10月
2009年 09月
2009年 08月
2009年 07月
2009年 06月
2009年 03月
2009年 02月
2009年 01月
2008年 12月
2008年 09月
2008年 08月
2008年 07月
2008年 04月
2008年 02月
2008年 01月
2007年 12月
2007年 07月
2007年 04月
2007年 02月
2007年 01月
2006年 11月
2006年 10月
2006年 09月
2006年 08月
2006年 07月
2006年 06月
2006年 05月
2006年 04月
2006年 03月
2006年 02月
2006年 01月
2005年 12月
2005年 11月
2005年 10月
2005年 09月
2005年 08月
2005年 07月
2005年 06月
2005年 05月
2005年 04月
2005年 03月
2005年 02月
2005年 01月
2004年 12月
2004年 11月