テキストをHTMLに変換してWord移植を楽にするぞ!ツール Ver 0.94

制作 諸熊



1:概要


1.1:目的

仕事において、重い・愛称悪い・見直しが大変、でも使わざるえないWord文書の作成を何とか楽にしたい、という考えのもと作られたツールです。
目的はズバリ、ベタ打ちのテキストを書式付HTMLに変換することです。これをWordで読むことで、面倒な書式設定などをできるだけ省略し、効率向上を目指します。


1.2:経緯

仕事でやたらとWord文書を書かされることがあります。大半はレポート関係なのですが、どっちにしてもベタなテキストを出すと怒られるんです。
が、Wordにするのは何かと面倒です。以下のような話があり、そんな非効率としか言えない文書が当たり前なんて信じがたい話です。

  1. とにかく重い… Win98時代に使ってたWord、だいぶ早く動いてた記憶があるんですが、最近のWordは一々重たいです。音声の都合かもしれませんが、無駄にグラフィックに特化した賜物だと思います。
  2. 音声読み上げでの愛称がよろしくない… 以前からそうですが、MS-Wordは音声読み上げできない部分がいくつかあります。マクロを使って読んでるソフトは、マクロの都合でソフトが落ちることがありますし、普通に読めてるソフトでも、書式の確認がやりにくいとか、読み上げ遅延があるとか。
  3. どこまでやったか忘れる… 一番問題となる部分です。一日で作業が終わればいいのですが、日を跨ぐと忘れてしまいます。結局、また一から見直しをしたりしないといけず、特にインデントの確認には莫大な手間がかかってしまいます。
  4. スクリーンリーダーで読み取れる情報が少ない… スクリーンリーダーで読み取れる情報は、テキストと太字や斜体などの情報だけです。だからインデント情報などは読めなくて、けっこう不便です。

そんな編集作業をやる人は、だいたいテキストデータを書いてWordで書式を整えてると思います。でも、書式整えるのはけっこう大変です。そこで、何とかそれを楽にしたいと思いました。
というわけで、HTMLを書き出してWordで読ませる、という結論に至ってこのプロジェクト始動です。ちょうど別件でテキストデータに見出しなどを書き出す実験を成功させていたので、応用してやるだけで順調に進みました。


1.3:特徴

テキストデータを読み込んでHTMLファイルを打ち出します。HTMLでは見出し、文字サイズ、色、箇条書き、画像埋め込み、表など一通りできそうなことを入れることができ、それがWordにも反映されます。
また独自の文法を持っており、タグを埋め込むことで、テキストを整形します。またベタなテキストでも、レポートっぽい形式で書いてあれば、自動制御でそこそこの見出し、インデントを設定してくれます。というか未改造のテキストをうまくやるのが目標です。


見出しやインデントの基準には、ユーザビリティ専門家の方が絶賛している「見出しを突出させるためのぶら下げインデント「「一行の幅は50%〜60%が読みやすい」を採用しているので、読みやすさに特化しています。
また文字装飾などは、範囲を決めて行います。やっていることはHTMLそのままですが、英語タグでなく日本語タグにしているので、だいぶわかりやすいと思います。
表の打ち出しは、もはや全盲にはできないとさえ揶揄される部分を徹底的に対応し、簡単なテキストを表に変換できます。また音声環境で表を読んだ時に起こるさまざまな問題をクリアできるようにしてみました。


あと、このツールを正しく使うことで、WEB JIS X8341-3のほとんどの項目を満たすことができ、デフォルトでも等級Aを満たします。文字サイズの変更方法を説明すれば冗談抜きでAAA達成します。
ただし、HTMLオーサリングツールではありません。あくまでワード移植を楽するのが目的なので、凝ったHTMLを作るのは不得意ですし、HTMLとしてもClassClassうるさいものになります。DivDivDivよりはるかにマシですけど。


1.4:使い方

使い方は三つありますが、いずれも「TXT2HTML.exe」に対して行います。Explorerなどでクリックして開くか、コマンドライン上で実行するか、または同根の変換用.txtに変換したいファイル名を書き込むかの3パターンから選択できます。

この性質から、おそらくTXT2HTMLのアイコンにテキストファイルをドラッグ&ドロップしても変換できます。ただアプリの独自アイコンが無いので、上記3つのどれかで起動した方が楽だと思います。


いずれかの結果、同じファイル名の先頭に「HTML_」と付いたファイルができ上がります。また同じフォルダに、表示するためのスタイルシート「WordStyle.css」または「WebStyle.css」が書き出されます。この二つのファイルは同一フォルダに置かないと意味がありません。
※Version0.88からスタイルシートをHTMLと分けて書き出すようにしました。それまではヘッダ部分に書いてあったのでそのファイル1個で簡潔していたのですが、ヘッダ部分が100行以上とか、ちょっと長いじゃないですか?


ちなみに私は、このツールを「送る」メニューに追加し、テキストファイルをそこにぶち込んで使っています。やりたい人は、このツールを「SendTo」フォルダへぶち込んで下さい。
なお変換中、20%進む毎に音が鳴ります。変換に要する時間は、私の環境ではテキスト20kb秒くらいでした。ただしこの処理にファイルへの書き出し時間は含まれませんので、80%から終了までは長くなる場合があります。


その後どうするかですが、MS-wordなどのワープロソフトを起動し、できたHTMLを読み込みます。その後ファイルをdoc形式で保存すれば、書式を引き継いだ状態でdocが作られてくれるはずです。
MS-wordにてHTMLを初めて読み込んだ状態では、表示がWEBレイアウト表示になっているため、ページ番号や行数を正しく表示できません。表示メニューにある「印刷レイアウト」にチェックを入れることで正しく読めるようになります。
なお、用紙の上下左右の余白を調整することは問題ありませんが、段落設定で行間を狭くしないで下さい。表のセルが潰れてしまい、手で膨らます作業が必要になってしまいます。


基本的にそれだけです。あくまで「テキストをHTMLにしてWord移植を楽するぞ!」が目的なので、ポイッと投げて終わるくらいがいいんです。


1.5:使い時

このソフトが威力を発揮するのは、いかの場合です。


1.5.1:レポートや報告書のようなものを作る必要がある時

これは、このツールが作られるきっかけそのものなので、何よりも重要です。だから、ぶっちゃけ残りはおまけ的な用途になります。
ベタ打ちのテキストに項目番号を割り振り、適度に改行を入れてから変換すると、アウトライン付きのWordが作成されます。目次にリンクを張る機能もあり、Wordとして申し分ない活躍をしてくれるはずです。


1.5.2:全盲がWEBページなどを作る場合で、晴眼者に見て欲しい時

晴眼者をターゲットとする一般的なWEBページは、文字サイズやスタイルがきめ細かく設定されています。が、その多くは全盲者には何の価値も無いものなので、どうしても優先度が低くなります。
そんな問題も、このツールならかなり楽です。特に文字の大きさ、インデントが自動化され、文書を書くことに専念できます。まぁ自動で色は付けたりしないんですけどね。
また、HTMLは読みやすいように整形して出力するので、ホームページの初心者にも便利かもしれません。特にPとかBRとか、H1とか、ちょっとわかりにくいじゃないですか。


1.5.3:アクセシビリティが高いHTMLを目指したい時

このツールで打ち出されるデータは、音声読み上げ環境で詰まりにくい設計になっています。画像に必ずAlt属性を指定させたり、表の説明を付けさせたり、行数を補助する機能を付けたりします。またページ内へのリンクも充実しており、メニュー追加も容易です。
意外と知られていないAccesskeyにも対応しているので、携帯向けサイトの設計にも一役買います。ちなみに、JIS X8341-3にも一部配慮できるようにしています。


1.5.4:PDFを作りたいけど構造化が面倒で、できるだけ省略したい時

HTML、Wordと来ると、時々出てくるPDF。が、PDFの読み上げはけっこう悲惨で、文書が構造化されていないことにより、読み出すと固まるHCDの資料とかすさまじいものがゴロゴロあります。
そんな構造化ですが、手でやるのがめんどいので、こっちで勝手に付けてしまおう、という意図があります。もともとWordを作る支援ツールなので、それっぽく書いておけば、アウトラインも整ってくれるのが特徴です。
なお、アクロバット、Office2007〜2010にあるPDF出力アドインでタグ付きPDFを指定して検証した所、特に問題なく文書を読むことができました。タグ付きPDFが書けるソフトなら他のでもいけるかもしれませんが、Office2007や2010があるなら保存アドインを使うのが最も確実でしょう。





3:ダウンロード

以下より、ツールのダウンロードができます。自己解凍書庫になっているので、起動するとメッセージに従って解凍します。
インストール・アンインストールにおいては、出てきたファイルだけを裁けばOKです。一応、ファイルダイヤログの都合でレジストリが残りますが、ほっといても問題ありません。
テキストをHTMLに変換〜〜ツールのダウンロード 600KBくらい





ページの一番上に戻る
諸熊の館に戻る