HOMEこのサイトについて新着情報作成編入稿編整理編ソフト関連リンク


テキストファイルを作る時のQ&A

Q1-1 「プレーンテキスト」って何?

A1-1 文字情報だけのテキスト

 プレーン(Plain)とは「飾りのない」「質素な」という意味ですから「飾らないテキスト」、つまり文字情報だけのテキストをさします。これは、入稿用のテキストとして最もふさわしいものです。
 通常、テキストにはさまざまな修飾が施されます。書体や文字サイズの変更、字下げをしたりアンダーラインをつけたり、傍点をつけたり等々、実にさまざまです。しかしこれらの修飾はソフト間の互換性に乏しく、実際、各種のコンバータで変換すれば、これらの修飾情報の多くは無視され、変換されません。
 こうした互換性の問題の他、DTPのレイアウトソフトで各種の文字修飾を行うためにも、ゼロから出発できるプレーンテキストの方が適しているのです。
 そこで、入稿ファイルを作る場合は、次のように二本立てで考えるのがよいと思います。
  1. 原稿は通常通り普通に作る……印刷してプリント原稿とする。
  2. そのファイルをコピーしてプレーンテキストにする……入稿用ファイルとする。
 ワープロやパソコンのワープロソフトで作ったファイルも、MS-DOS変換するなりテキスト形式で保存すれば、簡単にプレーンテキストにできます。もちろん、プリント原稿とファイルの内容が異なっていると困りますから、変換作業は最後の仕事です。
(記/小国文男)

▲TOP <<BACK


Q1-2 スペースを埋めて改行するとどんな不都合がある?

A1-2 スペースは改行の役割を果たさない

 改行キーを使わずにスペースを埋めて改行したデータは、1行ずつ全ての行に改行コードが入っているデータと共に、入稿される困ったデータの東西の横綱という感じです。
 スペースを埋めて改行したデータは、DOS変換を経て、下のサンプルのようになって私たちの手元にやってきます。

サンプル

 ところどころの空白が改行のために埋められたスペースです。ご覧のように、一連の連続した一つの文になっています。DOS変換時に全角スペースが半角に変換されることも多いので、たとえ1行の文字数を合わせていても、スペースが改行の役割を果たすことは皆無といってよいでしょう。
 このスペースを取り除く作業も、実はやっかいです。単純にスペースを削除すれば、正しい改行位置がわからなくなってしまいます。便利な検索・置換のスクリプトもありますが、最初から改行キーを使って確実に改行されたデータであるのが一番です。

(記/小国文男)

▲TOP <<BACK


Q1-3 ピッタリ行末で段落が終わった。改行キーを使わずに次行を打ってもよい?

A1-3 見た目に1行空いても、改行キーで改行を

 段落が行末で終わった場合に改行キーで改行すると、次の行頭に改行マークが送られて、見た目には1行空いてしまうことがよくあります。きれいにプリントするために、そのまま次の行に続けて入力するのは理解できます。
 しかし入稿データの場合は、見た目に1行空いても、改行キーで改行してください。
 改行コードが入っていないデータは連続した一つの文となり、段落で正しく改行されません。現場ではプリント原稿と照合しながらチェックしていますが、それでも見落とす場合はあります。校正時、文中に不要な1字分のスペースがあれば、その原因のほとんどはこのためです。
 仮に1行の文字数を仕上がりに合わせて書式設定をしていても、組版をすれば、禁則処理などのために原稿通り行末で段落が終わるとは限りませんし、文字数を合わせていなければ、いわずもがなです。
 なお、DTPのレイアウトソフトや多くのパソコン用ワープロソフトは、行末に改行コードがあっても、その行に収まるようになっています。
(記/小国文男)

▲TOP <<BACK


Q1-4 引用の字下げにインデント機能を使うのは問題ないか?

A1-4 基本的に問題ないが、機種やソフトによっては要注意

 インデントは字下げのための機能で、行頭位置を指定幅だけ下げる働きをします。引用や箇条書きに利用すると便利な機能です。
 インデントを使って字下げをしたファイルをMS-DOS変換すると、通常はインデントが無視されて、字下げのないプレーンテキストになります。パソコンのワープロソフトでテキスト形式に保存した場合も同様で、こうなれば何の問題もありません。
 困るのは、インデントではなくスペースで字下げをしている場合です。たとえば2字下げだと、一定の間隔で文中に2個のスペースが含まれることになります。字下げをせずに、プリント原稿に「2字下げ」と書き込んで指定されている方が、ずいぶんありがたいのです。
 ところがせっかくのインデントも、機種やソフトによっては、DOS変換の際にスペースに置き換わるものがありますから要注意です。一度確かめてみて、スペースに置き換わるようなら、インデントは使わない方がよいでしょう。
(記/小国文男)

▲TOP <<BACK


Q1-5 3段組み編集の予定なので、段組みの原稿にしたいが?

A1-5 段組用のテキストは1段分の書式設定で作るのがよい

 ワープロを使った段組み編集は、入稿ファイルとしてはふさわしくない形のチャンピオンです。
 ワープロで段組み編集をするには、テキストエリアに表を作ったり罫線で区切って、その中に入力していく方法が一般的だと思います。こうして作られたファイルは、DOS変換を経て入稿されると、次のようなファイルとなって私たちの目の前に現れます。

サンプル

 ご覧の通りです。ウインドウ幅を調整して、ようやく段組みしてあることがわかりますが、スペースが半角に変換されていたりすると、きれいに段組みに再現されずにガタガタになってしまいます。そして、最大の問題は3段分が1行の文として続いていることです。もともと大きなテキストエリアを分割しているのですから当然です。
 これらを矩形選択で別のファイルに移して整理するわけですが、場合によっては打ち直した方がよほど作業が早く済むということも少なくありません。
 段組編集に合わせて原稿を作成する場合は、1段分の書式設定にするのがよいでしょう。それを3ページ打てば3段分となります。

(記/小国文男)

▲TOP <<BACK


Q1-6 数字は全角がよい? 半角がよい?

A1-6 編集方針によります

 編集方針によって入力の方法が変化します。
 DTPで使うフォントでは全角・半角という区別はなく、1バイト文字・2バイト文字という分類になり、半角に当たるのが1バイト文字になります。

 横書きのドキュメントでは「半角(1バイト)」での入力が一般的ですが、「1桁は全角、2桁以上は半角」で入力する場合もあります。
 縦書きのドキュメントでは「縦書きは基本的に洋数字を使わず漢数字」が基本だと思いますが、その場合も、「百二十五」とするのか「一二五」とするのか、編集方針によって変わります。
 また、縦書きに洋数字を使う場合、文字回転の関係で1桁は全角、2〜3桁は半角、4桁以上はまた全角というような例もあります。これもまた編集方針によって変わってきます。

(記/大橋幸二)

▲TOP <<BACK


Q1-7 欧文は全角がよい? 半角がよい?

A1-7 編集方針によります

 編集方針によって入力の方法が変化します。
 DTPで使うフォントでは全角・半角という区別はなく、1バイト文字・2バイト文字という分類になり、半角に当たるのが1バイト文字になります。
 たとえば、「Q&A」と「Q&A」の違いが1バイト文字と2バイト文字の違いで前者が1バイト文字です。

 横組みのドキュメントでは、1バイト文字を使うようにします。2バイト文字では文字と文字の間に不用意なアキを生じてしまいます。
 縦書きの場合は「MAC」などの略称は全角で、「Machitosh」と単語または文になると半角が一般的でしょう。また、欧文を使わずにカタカナに置き換えることもよくあります。

(記/大橋幸二)

▲TOP <<BACK


Q1-8 括弧の前後を詰めてほしいので半角括弧にしてもよいか?

A1-8 括弧は必ずすべて全角で入力する

 テキストファイルでは括弧はすべて全角で入力して、レイアウトソフト上で半角になるように前後のアキを詰めます。また、前後のアキの指定はデータに添付する出力紙に解りやすく赤字で「括弧はすべて前後詰め」などと書いておくとよいでしょう。
(記/大橋幸二)

▲TOP <<BACK


Q1-9 名前や地名などの特殊な文字はどうする?

A1-9 データは「■」などで代用し、プリント原稿で指示をする

 特に人名や地名などでは、いわゆる「はしご高」をはじめ、コンピュータで使える「文字セット&文字コード表」にない文字が必要になることがよくあります。DTPの現場では、外字フォントを使ったり、それでもなければ作字をして、これらに対応しています。

 入稿するデータをつくる場合、「文字セット&文字コード表」にない文字を入力するのは不可能ですから、「■」などの記号類で代用しておき、プリント原稿に正しい文字を楷書でハッキリ書いて指示するのがよいでしょう。
 なお、一部の文字セットでは「はしご高」などを含んでいるものもあります。しかしこれらは「機種依存文字」ですので、使用しない方が無難です。またもちろん、ないからといって外字を作って入力するのは避けるべきです(Q1-17参照)。

 参考→DTPで使われている外字フォント(ビブロス外字セット2)の例

(記/小国文男)

▲TOP <<BACK


Q1-10 絵記号を使いたいが?

A1-10 絵記号は使えない

 イラスト風の絵記号は、そのほとんどがワープロ専用機の機種異存文字です。それぞれのワープロでしか使えないと理解するのが妥当でしょう。もちろんデータ変換時には文字化けします。したがって、入稿データとしては使えません。
 文字セットのうち文字化けせずに確実なやりとりができる記号は、以下のとおり限られています。
+−±×÷=≠<>≦≧∞∴♂♀°′″℃¥$¢£%#&*@§
☆★○●◎◇◆□■△▲▽▼※〒→←↑↓〓
 DTPで使う外字フォントのなかには、数種類の電話やFAXマークをはじめ各種のマーク類があります。また、イラストデータとして作成することも可能ですので、どうしても絵記号類を使いたい場合は、入稿先と相談されるのがよいでしょう。
 なお、丸数字や括弧付き数字、単位などについては、Q1-12Q1-13Q1-14を参照してください。
(記/小国文男)

▲TOP <<BACK


Q1-11 欧文の前後には半角スペースを入れるべき?

A1-11 半角スペースはほとんど不要だが、入稿先と確認するのが無難

 和文と欧文の間は通常「四分アキ」と言われ、全角の4分の1の間隔を入れます。そのことをご存知の方と思われますが、和文と欧文の間に半角スペースを入れたテキストデータがよくあります。
 これについては、あらかじめ入稿先と確認するのがよいでしょう。

 というのは、DTPで使用しているレイアウトソフトは、和文欧文間の間隔を自動処理できるものが多いからです。この場合は、わざわざ入れた半角スペースが不要なものになってしまいます。これを削除するとなったら、欧文中の必要なスペースも削除されかねず、やっかいな場合もあります。それに、半角スペースは四分アキスペースでもありません。

 また、実際の出版物でも、和文欧文間にスペースを取っていないものはありますから(DTPによる日本語組版の乱れのひとつとも指摘されていますが、その議論は別に譲りましょう)、編集方針にも左右されます。
 確実に和文欧文間にスペースを入れたい場合は、プリント原稿に「和文欧文間は必ず四分アキ」などと明記しておけば、まずは大丈夫と思います。

(記/小国文男)

▲TOP <<BACK


Q1-12 丸数字や括弧付き数字を使いたいが?

A1-12 入力時には普通の数字で入力し、出力紙に指定を書き込む

 丸付き数字や括弧付き数字は「機種依存文字」といい、文字コードの違いにより文字化けを起こしてしまうので、普通の数字を使って入力して出力紙に赤い文字で「数字はすべて丸付き数字」のように指定を入れて入稿します。また、DTPでは丸付き数字や括弧付き数字は記号フォントという特別なフォントを使って出力します。
(記/大橋幸二)

▲TOP <<BACK


Q1-13 小さな「ページ」などを使いたいが?

A1-13 全角で入力して、プリント原稿で指示をする

 小さな「ページ」などの単位文字は「機種依存文字」と呼ばれ、メーカー、機種、OSの違いによって、データ入稿時に文字化けを起こす可能性が高い文字です。
 また、文字セット&文字コード表にあるものは種類も限られているため、DTPの現場では外字フォントなどを使用することが多いものでもあります。
 したがって、データ作成にあたっては全角文字で普通に入力し、プリント原稿に「単位文字に」などと指示をしておくのが安全です。

 なお、新聞や雑誌では単位文字が使われることが多いのですが、特に縦組みの書籍では単位文字を使わず普通に「ページ」などとする例が多いようです。

(記/小国文男)

▲TOP <<BACK


Q1-14 キロメートルや立方メートル、リットルなどの単位はどうすればよい?

A1-14 使える単位文字もあるが、「■」などで代用するのが無難

 残念ながら、「文字セット&文字コード表」に記載されている単位記号はとてもわずかです。しかもそれらが機種依存文字である場合が多いのも難点です。そのためDTPの現場では、外字フォントの単位記号を使用しています。
 とりわけグラムやリットル、それに立方メートルなど小文字を使う単位は特殊ですので、データでは「■」などで代用するか、英数文字で「kg」「m3」などとし、プリント原稿に赤字で正しい単位記号を指示しておくのが最も無難でしょう。
 文字化けの心配なく使用できる単位記号類は次の通りです。
∞∴°′″℃¥$¢£%&@

 また、次のような1文字の単位には英数文字(または全角英字)やギリシャ文字が使えます。
a(アール)、A(アンペア)、m(メートル)、W(ワット)、オーム(Ω)、γ(ガンマ)、π(パイ)など

 さらに、横書きであれば英数文字を組み合わせて使えます。
cm(センチメートル)、km(キロメートル)、cal(カロリー)、pH(ペーハー)、Hz(ヘルツ)、ha(ヘクタール)、dB(デシベル)など
 英数文字やギリシャ文字を使った場合でも要注意ですから、プリント原稿にそれらがわかるように赤字でマークしておくのがよいでしょう。それらを正しい単位記号に置き換えることもあります。
 また、複数の単位を使うときは代用記号などを、たとえばグラムは■、キログラムは□などと決めて使用しておくと、一括置換ができますので助かります。
(記/小国文男)

▲TOP <<BACK


Q1-17 自分で作った外字は使えるか?

A1-17 外字は使えません

 ワープロ専用機やパソコンのワープロソフトで作成した外字は使えません。確実に文字化けしますから、該当する文字は必ず「■」などで代用し、プリント原稿に正しい文字を楷書で朱書きして指示します。
 特に古い機種などでは、外字の区点コードを84区に割り当てるものがありますが、ここには1983年および90年に漢字が追加されており(堯槇遙瑤凜熙)、これらの文字に化けることがあります。こうなるとデータ中で発見されにくく、誤植の原因になりかねません。

 ただし、コンピュータのフォント作成用のソフトで作成したものは使用できます。もちろんOSやコンピュータのシステム環境に左右されますので、無駄骨を折らないよう、入稿先とよく確認した上で作成するのがよいでしょう。この場合は、データと共に必ずフォントファイルも入稿します。

※参考→DTPで使用している外字(ビブロス外字セット2)の例

(記/小国文男)

▲TOP <<BACK


Q1-18 ハイフンと音引きはどう違う?

A1-18 音引きはカナ文字、ハイフンは記号と、全く違う文字

 音引きは「コンピュータ」などに使う「ー」で、これはカナ文字です。ハイフンは「2−3」などの「−」で、これは全角または半角の記号です。
 これが混同されているデータが少なくなく、プリントしてからビックリというケースがよくあります。縦組みではハイフンは横向きになります。
 音引きの左端が折れているのが識別するポイントですが、環境や表示フォントによってはまったく同じに表示されますからやっかいです。音引きとハイフンを入れ替えた「コンピュ−タ」「2ー3」、ご覧の画面で確認できるでしょうか?

 初期のワープロには音引きがありませんでした。仕方なくハイフンで代用していたという歴史があります。また、縦書きハイフンがなく、これを音引きで代用したという事情もあります。
 最近の実情としては、キーボード上で音引きの位置がわかりにくく、テンキーにあるハイフン(マイナス記号)を使ってしまうというケースが多いようです。

 キーボードで音引きとハイフンの位置を確認し、正しく使い分けることが、誤植をつくらないためにも重要です。

(記/小国文男、情報/Ogo)

▲TOP <<BACK


Q1-19 表を含む原稿はどのように作る?

A1-19 表とテキストは別々に作る

 表を含む原稿の場合、テキストと表部分の原稿を別のファイルにするか、同じファイルの中でも明確に区別して作ります。

 よく、テキスト中に表をレイアウトして作ってあるデータがありますが、DOS変換などをを経てプレーンテキストにすると、ごちゃごちゃのファイルになってしまいます。
 したがってテキストと表は区別し、テキスト中に(ここに表1)などと括弧書きしておくのが無難です。表のデータは、その作り方について、あらかじめ入稿先と確認するのがよいでしょう。一般的には次のような方法があります。

 ワープロで表データを作る場合は、罫線を使わず(罫線素子またはスペースなどに変換されるので使えない)、データ部分のみを行方向(横)に、列ごとにタブで区切って作るのが一般的です。タブが使用できない場合は、スペース2個など一定の間隔で区切るようにします。また表によっては、列方向(タテ)に改行コードで区切って作る場合もあります。
 エクセルやロータス1-2-3などの表計算ソフトを使ってデータを作る場合は、データをタブ区切りやコンマ区切りのテキストに書き出し、テキストファイルとして入稿します。
 いずれの場合も、一旦表を作ってプリントし、それを完成原稿とした上で、入稿用のデータはそこからデータ部分のみを抜き出して作ると考えればよいと思います。

(記/小国文男)

▲TOP <<BACK


Q1-20 普通に作ったはずなのに「行改行している」と言われたが、なぜ?

A1-20 原因のほとんどはデータ変換と電子メール

 わざわざ1行ごとに改行キーで改行するのは手間な作業です。そのようにしてワープロ入力をする方は少ないと思います。ではなぜ行改行されたデータになるのか。およそ次の三つの原因が考えられます。
  1. 保存時に「行改行テキスト」形式で保存した
  2. DOS変換時に行改行形式に変換された
  3. 電子メールで送信した際に行改行形式に変換された
 1については、ワープロソフトによって保存時に「行改行テキスト」形式を選択できるものがありますから、うっかり間違えないように注意が必要です。
 しかし、ほとんどの場合は2と3のケースが原因です。これについては「入稿編」で詳しく扱っています。
(記/小国文男)

▲TOP <<BACK


Q1-21 「機種依存文字」って何?

A1-21 メーカーや機種、OSの違いなどによって文字コードが異なる文字群

 コンピュータで使える文字には「1バイト文字」と「2バイト文字」があります。1バイト文字は、いわゆる半角英数字と呼ばれる文字です。アルファベットと一部の記号は世界共通で使用できます。2バイト文字は全角文字とも言われ、1バイト文字では足りない日本語の文字はこれで表されます。
 日本語はJIS規格で定められており、「JIS非漢字」「JIS第1水準漢字」「JIS第2水準漢字」に大別されます。これらの一覧を「文字セット」と呼び、文字が指定されている番号を「文字コード」と呼びます。

「文字セット&文字コード表」には「メーカー拡張エリア」と呼ばれるJIS規格未定義のエリアがあります。ここに1〜20までの丸数字、括弧付きの曜日、単位記号、単位文字、(株)などの省略文字などが納められているほか、外字エリアとしても使用されています。
 ここは同じ文字でもメーカーによって文字コードが違います。有名なものには「NEC外字」と「通産省外字」があります。ですから、メーカーや機種、OSの違いなどによって文字化け(別の文字が表示される)を起こす可能性が高い文字群です。このような文字群を「機種依存文字」と呼んでいます。
 これは同じOSであっても要注意で、たとえばMacintosh用フォントのメーカー拡張エリアは、PSフォントに「NEC外字」が使われ、TrueTypeフォントには「通産省外字」が使われています。

「機種依存文字」を「文字セット&文字コード表」の区点コードで示すと、次の通りです。

09区〜15区、85区以降のメーカー拡張エリア
02区の一部(◆□■△▲▽▼※〒→←↑↓〓)を除く記号類
08区の形成素片等
84区の漢字(堯槇遙瑤凜熙)以外
(※一部に84区を外字エリアとしている場合があり、外字が上記漢字に化けることがあります。もちろん、外字は入稿データに使用しないことが原則です)
 パソコンやワープロのマニュアルには「文字セット&文字コード表」が付属していますので、一度確認してみてください。

 また、半角カタカナも使用しない方が無難です。半角カタカナには、日本でのみ割り振られている1バイト文字と、メーカー拡張エリアにある2バイト文字があります。いずれもDTPでは使用していません。
(記/小国文男、情報/Ogo&辰野純也、参考/ワークスコーポレーション「DTP WORLD別冊 フォントデザインブック'98」1998年)

▲TOP <<BACK


Q1-22 UNIXでテキストファイルを作るときの文字コードは?

A1-22 Shift-JIS形式の文字コードを使用する

 プレーンテキストは、Shift-JIS形式の文字コードを使用してファイルを作成します。  現在主に利用されている文字コードとしては、Shift-JIS(DOS/WindowsやMacintosh)、JIS(インターネット)、EUC-jp(UNIX)、ユニコード等がありますが、パソコンDTPではMacintoshやWindows95等で処理されることが多いため、Shift-JIS形式が最もトラブルがありません。
 どうしてもShift-JIS形式以外の文字コードを使う場合は、必ずその文字コードを明記するようにします。
(記/小国文男、情報/Ogo)

▲TOP <<BACK


Q1-23 ルビはどうする?

A1-23 プリント原稿に朱書きするか、括弧書きで入力しておく

 ルビは文字修飾の一種ですから、ワープロ専用機やパソコンのワープロソフトでルビをつけても、DOS変換によってプレーンテキストになると、消えてしまったり、被ルビ文字とごっちゃになったりします。

 ルビを含むデータを作るには、次のような方法があります。

  1. データにはルビを入れず、プリント原稿に赤字で書き込む
  2. 被ルビ文字の直後に括弧書きで(ルビ・○○○)などと入力し、プリント原稿にもその位置を赤字でマークしておく
 そのほか、レイアウトソフトの仕様に合わせてルビのデータを作る方法もあります。また、行間のせまい新聞などでは、ルビを使わずに括弧書きにしている例もあります。どのようにしておくのが一番よいかは、入稿先とよく確認するのがよいでしょう。
(記/小国文男)

▲TOP <<BACK


[BACK]

監 修

データ入稿「困ったちゃん」プロジェクト(C)1998