1:概要
1.1:目的
仕事において、重い・愛称悪い・見直しが大変、でも使わざるえないWord文書の作成を何とか楽にしたい、という考えのもと作られたツールです。
目的はズバリ、ベタ打ちのテキストを書式付HTMLに変換することです。これをWordで読むことで、面倒な書式設定などをできるだけ省略し、効率向上を目指します。
1.2:経緯
仕事でやたらとWord文書を書かされることがあります。大半はレポート関係なのですが、どっちにしてもベタなテキストを出すと怒られるんです。
が、Wordにするのは何かと面倒です。以下のような話があり、そんな非効率としか言えない文書が当たり前なんて信じがたい話です。
- とにかく重い… Win98時代に使ってたWord、だいぶ早く動いてた記憶があるんですが、最近のWordは一々重たいです。音声の都合かもしれませんが、無駄にグラフィックに特化した賜物だと思います。
- 音声読み上げでの愛称がよろしくない… 以前からそうですが、MS-Wordは音声読み上げできない部分がいくつかあります。マクロを使って読んでるソフトは、マクロの都合でソフトが落ちることがありますし、普通に読めてるソフトでも、書式の確認がやりにくいとか、読み上げ遅延があるとか。
- どこまでやったか忘れる… 一番問題となる部分です。一日で作業が終わればいいのですが、日を跨ぐと忘れてしまいます。結局、また一から見直しをしたりしないといけず、特にインデントの確認には莫大な手間がかかってしまいます。
-
スクリーンリーダーで読み取れる情報が少ない… スクリーンリーダーで読み取れる情報は、テキストと太字や斜体などの情報だけです。
だからインデント情報などは読めなくて、けっこう不便です。
そんな編集作業をやる人は、だいたいテキストデータを書いてWordで書式を整えてると思います。でも、書式整えるのはけっこう大変です。そこで、何とかそれを楽にしたいと思いました。
というわけで、HTMLを書き出してWordで読ませる、という結論に至ってこのプロジェクト始動です。ちょうど別件でテキストデータに見出しなどを書き出す実験を成功させていたので、応用してやるだけで順調に進みました。
1.3:特徴
テキストデータを読み込んでHTMLファイルを打ち出します。HTMLでは見出し、文字サイズ、色、箇条書き、画像埋め込み、表など一通りできそうなことを入れることができ、それがWordにも反映されます。
また独自の文法を持っており、タグを埋め込むことで、テキストを整形します。またベタなテキストでも、レポートっぽい形式で書いてあれば、自動制御でそこそこの見出し、インデントを設定してくれます。
見出しやインデントの基準には、ユーザビリティ専門家の方が絶賛している「見出しを突出させるためのぶら下げインデント「と「一行の幅は50%〜60%が読みやすい」を採用しているので、読みやすさに特化しています。
また文字装飾などは、範囲を決めて行います。やっていることはHTMLそのままですが、英語タグでなく日本語タグにしているので、だいぶわかりやすいと思います。
表の打ち出しは、もはや全盲にはできないとさえ揶揄される部分を徹底的に対応し、簡単なテキストを表に変換できます。また音声環境で表を読んだ時に起こるさまざまな問題をクリアできるようにしてみました。
あと、このツールを正しく使うことで、WEB JIS X8341-3のほとんどの項目を満たすことができ、デフォルトでも等級Aを満たします。文字サイズの変更方法を説明すれば冗談抜きでAAA達成します。
ただし、HTMLオーサリングツールではありません。あくまでワード移植を楽するのが目的なので、凝ったHTMLを作るのは不得意ですし、HTMLとしてもClassClassうるさいものになります。DivDivDivよりはるかにマシですけど。
1.4:使い方
使い方は三つありますが、いずれも「TXT2HTML.exe」に対して行います。Explorerなどでクリックして開くか、コマンドライン上で実行するか、または同根の変換用.txtに変換したいファイル名を書き込むかの3パターンから選択できます。
-
Explorer上から起動した場合、ファイルダイアログが出てきます。
ここで変換したいファイル(txt)を選択すると、勝手に変換が始まり、結果を出力して終わります。 -
コマンドラインから起動した時は、そこで与えたコマンドライン引数のファイルが全て変換の対象となります。
またコマンドラインでも、引数なしで起動すると、やっぱりファイルダイアログが出てきます。 -
「変換用.txt」は、何の変哲もないテキストで、変換したいファイル名を書き込みます。そしてツールを起動すると、そこに書かれたファイルを変換します。やっていることはバッチファイルと変わりませんが、今時はプロンプトを知る人も少なくなったため、「TXT2HTML ファイル名.txt」のバッチを作ってね!ではダメらしいです。
ちなみに一行1ファイルなので、空白があってもクォーテーションの必要はありませんし、拡張子も省いてかまいません。
この性質から、おそらくTXT2HTMLのアイコンにテキストファイルをドラッグ&ドロップしても変換できます。
いずれかの結果、同じファイル名の先頭に「HTML_」と付いたファイルができ上がります。また同じフォルダに、表示するためのスタイルシート「WordStyle.css」または「WebStyle.css」が書き出されます。この二つのファイルは同一フォルダに置かないと意味がありません。
※Version0.88からスタイルシートをHTMLと分けて書き出すようにしました。
ちなみに私は、このツールを「送る」メニューに追加し、テキストファイルをそこにぶち込んで使っています。
なお変換中、20%進む毎に音が鳴ります。
その後どうするかですが、MS-wordなどのワープロソフトを起動し、できたHTMLを読み込みます。
MS-wordにてHTMLを初めて読み込んだ状態では、表示がWEBレイアウト表示になっているため、ページ番号や行数を正しく表示できません。
なお、用紙の上下左右の余白を調整することは問題ありませんが、段落設定で行間を狭くしないで下さい。
基本的にそれだけです。あくまで「テキストをHTMLにしてWord移植を楽するぞ!」が目的なので、ポイッと投げて終わるくらいがいいんです。
1.5:使い時
このソフトが威力を発揮するのは、いかの場合です。
- レポートや報告書のようなものを作る必要がある時
- 全盲がWEBページなどを作る場合で、晴眼者に見て欲しい時
- アクセシビリティが高いHTMLを目指したい時
- PDFを作りたいけど構造化が面倒で、できるだけ省略したい時
1.5.1:レポートや報告書のようなものを作る必要がある時
これは、このツールが作られるきっかけそのものなので、何よりも重要です。
ベタ打ちのテキストに項目番号を割り振り、適度に改行を入れてから変換すると、アウトライン付きのWordが作成されます。
1.5.2:全盲がWEBページなどを作る場合で、晴眼者に見て欲しい時
晴眼者をターゲットとする一般的なWEBページは、文字サイズやスタイルがきめ細かく設定されています。
そんな問題も、このツールならかなり楽です。
また、HTMLは読みやすいように整形して出力するので、ホームページの初心者にも便利かもしれません。
1.5.3:アクセシビリティが高いHTMLを目指したい時
このツールで打ち出されるデータは、音声読み上げ環境で詰まりにくい設計になっています。
意外と知られていないAccesskeyにも対応しているので、携帯向けサイトの設計にも一役買います。
1.5.4:PDFを作りたいけど構造化が面倒で、できるだけ省略したい時
HTML、Wordと来ると、時々出てくるPDF。が、PDFの読み上げはけっこう悲惨で、文書が構造化されていないことにより、読み出すと固まるHCDの資料とかすさまじいものがゴロゴロあります。
そんな構造化ですが、手でやるのがめんどいので、こっちで勝手に付けてしまおう、という意図があります。
なお、アクロバット、Office2007〜2010にあるPDF出力アドインでタグ付きPDFを指定して検証した所、特に問題なく文書を読むことができました。