3部の追加情報

マルチリンガルWebガイド

出版社: オライリー・ジャパン

Move to the English Part.

出版後に気が付いた点や訂正事項を書いてあり、今後の改訂版・各国語版に備えるものです。

3部 マルチリンガルWebページの作成

7章 マルチリンガルWebページの作成準備

7.2.1 Webページを世界に発信する際の注意点
[p.221]:
イギリスでは有限会社(limited liability company)と株式会社(合資会社joint stock company、米国ではshareholder owned company)に相当する会社をJohn Smith & Company Ltdと表現する場合が多く(LtdはLimitedの略)、このうち株式および財務内容が公開されているものをLloyds Bank PLCのように(PLCはPublic Limited Company)のようにいっています。イギリス文化の影響を受けたカナダ、オーストラリア、シンガポールなどでは、PLCに対して公開されていない会社をJohn Smith & Company Pte. Ltd. (Pte. Ltd.はPrivate Limited)という表現も使っています。アジアではマレーシアが英国の影響を多く受けましたが、The Straits Times Press (Malaysia) Berhad、Telekom Publications Sdn Bhdというのを見つけました。マレー語でSindiran Berhadは有限責任会社(英語でPrivate Limited)です。同じマレー語でも、オランダの影響が多いインドネシアではP.T. Solo(ソロ会社)というようにいい、P.T.はPersoran Terbatas(有限会社)の略です。

[p.224]: 次の4項目の記述を追加
■ 文化と歴史の背景

[7.2.1の最後のパラグラフ「季節感」をここに移動]
Webはデスクトップ・パブシッシングの1つですから、文化と歴史の背景にも注意を払う必要があります。例えば、日本を紹介するwebのインデックスに、日本のシンボルとして神社の鳥居を使うという際は、じっくりとその意味を検討してからにしましょう。日本は第2次世界大戦中に東南アジア諸国、特に台湾・台北市のThe Grand Hotelがあるところ、韓国・ソウル市の安重根(アン・ジュングン)記念館があるところに神社を建て、一般の人々にも神社崇拝を強要したため、この地域では現在でも全般的に神社の鳥居の絵に関して否定的な感情をもっています。

■ ヘボン式ローマ字と翻字

日本独特の言葉や固有名詞は、現在はヘボン式ローマ字を使うのが普通で、し、じ、ち、つ、じゃはそれぞれshi、ji、chi、tsu、jaと書きます。また、慣習として、北爪(きたづめ)さんはMr. Kitazume (Kitadumeではない)、哲っちゃんはstretcherなどの連想でTetchanと書き、b、m、pの直前のnはmで表わし、Asahi Shimbunとなります。それでも第2次世界大戦以前から本や論文を書いている方々で、日本式または訓令式ローマ字でsi、zi、ti、tu、zyaを使っている人(例えばTakahashiではなく、Takahasi)もいるので、それは尊重しましょう。

ある言葉(例えばロシア語)から表記方法が異なる他の言葉(例えば英語)へ文字を転写することを翻字(Transliteration)と呼んでいます。通常広く使われている翻字方法があり、ソビエト連邦の元首相ニキタ・S・フルシチョフ(Никита С. Хрущёв)は、英語でNikita S. Khrushchev、フランス語でKrouchtchev、ドイツ語でChruschtschowと書くのが普通です。発音もロシア語のフルシュチョーフに対して、それぞれクルーシュチェヴ、クルッチェフ、クルーシュチョフに近いものです。[注: ロシア文字Никита С. Хрущёв)は、半角で]

■ 住所のローマ字表記

これには郵政省の基準があるようで(ご存知の方はご連絡ください)、次の例

東京都太田区中野町3-8-9 永田ビル2F
Nagata Bldg. 2F, 3-8-9, Nakano-cho,
Ota-ku, Tokyo 310, Japan
のように郵便局の人たちが仕分け・配達に都合がいいように
  1. ヘボン式ローマ字で書く。ただし、母音に長音符号をつけないで省き、太田区はOta-ku、甲府市はKofu-shiと書き、それぞれOhta-kuやKohfu-shiとはしない。これは、外務省が都道府県に依頼して発行しているパスポートに使われる姓名の書き方(佐藤さんはSatoh、大藤さんはOhtohで、個人の好みは聞き入れない)と違うので注意しましょう。
  2. 永田ビル2FはNagata Bldg. 2Fと書く。2FはSecond Floor (2nd Floor)の略で和製米語(英国英語では2階はFirst Floorまたは1st Floor、1階はGround Floor)ですが、余りに頻繁に使われているので、2Fと書いていいでしょう。
  3. 中野町3-8-9は3-8-9, Nakano-choまたは8-9, Nakano-cho 3-chomeとします。関西では「なかのまち」と発音するでしょうから、その場合は発音通りにNakano-machiとします。南県町Minami-agata-machiなどの長い町名は、南と県の間にハイフンを入れると分りやすいと思います。
  4. 県、区、市、町、村などは、長野県Nagano-ken、杉並区Suginami-ku、横浜市Yokohama-shi、大磯町Oiso-machi、牟礼村Mure-muraなどと書きます。県をNagano PrefectureまたはNagano Pref.、区をSuginami Ward、市をYokohama City、町をOiso Town、村をMure Villageなどと書くのは間違いではありませんが、英語国民だけ向けということになるので、これはなるべく避けましょう。Yokohama-cityなどとハイフンを付けた書き方は、よくありません。
以上の基準は日本の代表的な大企業(例えば、日本IBMなど)では、名刺を製作する部門である総務課などが中心となり、かなり厳格に守られているものです。社員の姓名は、上の1.で述べた外務省方式を採っているようです。

■ 難しい言葉

これは大学院、また大学院を出た方々が多く働く国際機関などのWebに時々見かける問題ですが、英語でたまにラテン語が語源の難しい言葉を使うことがあります。これは極力避けましょう。例えば、

While in recent years Japan has greatly increased the amount of money given as official development assistance, there has not been a concomitant increase in the number of professionals working in the development field.
の中の「concomitant」という言葉は、私もスペルが「concommittant」の間違いではないかと辞書を引いてみた程で、英語のできる日本人でも95パーセント、米国人では60パーセントの人々は正確には理解できないでしょうか。Webster's New Collegiate Dictionaryなどには「accompanying」という意味とあるので、こうした分りやすい言葉で代用しましょう。もちろん、私はこんな言葉も使えるんだよ、という自慢する場合は除きます。こうした難しい英語の言葉で、他のやさしい言葉に置き換えることができる例には、他にどんなものがありますか。

コラム7 HTMLの定義をめぐる競争と協調
[p.229]:
HyperText Markup Language 4.0について簡単に触れていますが、W3C (World Wide Web Consortium)は'97年7月8日に、HTML 4.0 Working Draftを公表しています。同日付けのプレスリリース(英語版、フランス語版、日本語版)に簡単なサマリーが入っています。この日本語版は、MITのLCSの紹介で「Multicsの開発、Athenaプロジェクトの推進などを行なってきたところ」と英語版、フランス語版にはない表現も追加されていて、いかにも大学の指導教官が大学生に訳させたような感じで、なかなか気合いが入っていて好感がもてます。どなたが訳されましたか、ぜひご連絡ください。'97年11月4日、HTML 4.0 Proposed RecommendationSpecificationと共に発表されました。今後W3Cの会員200社のレビューと投票が行なわれ、6週間程で賛成されればRecommendationとなります。12月18日にHTML 4.0 Recommendationになった旨、改訂されたSpecificationと共に発表されました。注: W3Cは以前からXML Working Groupで作業を進めていたExtensible Markup Language (XML) 1.0を'97年12月8日にProposed Recommendationとして、'98年2月10日にRecommendationとしてXML 1.0 Specificationと共に発表しました。XMLはp.228で述べたSGMLをより簡素化しネットワークで使い易く拡張性あるものとしUnicodeを使っているもので、Lotus社のeSuite(Javaベースのオフィス・スィート)にはすでにこの機能が入っているといわれており、今後急速に企業用のHTML/SGMLエディターやHTML/SGMLブラウザに盛り込まれてゆくようです。

7.5 画像と音声
[p.232]:
画像のGIFファイルやJPEGファイルはWindows、Macintoshなどにより微妙な色合いなどの差が往々にしてあり見づらくなるので、こういった差をなくすようなPNG (Portable Network Graphics)がW3C(コラム 7、p.229参照)で'96年10月に合意されています。Greg RoelofsさんのPNG Home Pageによれば、PNGはPhotoshop 4.0、Picture Publisher 7などからサポートされており、ブラウザーもNetscape Navigator 4.04、Internet Explorer 4.0からサポートしています。

7.6.1 テキストエディタ
[p.234]:
Windows用のWZ Editor (ビレッジセンター)やHyperEdit(ディクレ、http://www.dicre.com)には、...

7.6.2 HTMLエディタ
[p.234]:
次を追加
HomeSite & Cold Fusion(Allaire社、http://www.allaire.com)とその日本語版(Allaaire社サポートセンター)
Fusion (NetObjects社、http://www.netobjects.com)とその日本語版三菱商事コンピュータ事業開発ユニット)

1997年7月から'98年2月にかけてNetscape Communicator (上記p.165の追加情報参照)とInternet Explorer 4.0 (上記p.166の追加情報参照) for Windows/Macintoshの英語版・日本語版が出荷され、それぞれにHTMLエディタ機能が付属しているので多数のユーザーが使い始めていますから、これらについて簡単に解説しておきます。Netscape CommunicatorをインストールするとHTMLエディタComposerがインストールされ、ComposerはNetscape Navigator 4.0のCommunicatorボタンでページComposerを、またはNetscape CommunicatorフォルダからNetscape Composerを選び起動できます。基本的にWYSIWYGのエディタで、表示(View)--->文字コードセットで選ばれた言語・文字でHTML文書を作ります。このフォントには欧文(ISO-8859-1)・中央ヨーロッパ(ISO-8859-2)/中央ヨーロッパ(Windows-1250)・日本語(自動選択)/日本語(Shift_JIS)/日本語(EUC-JP)・中国語(Big5)/中国語(EUC-TW)・簡体字中国語(GB2312)・韓国語(自動選択)・キリル文字(KOI8-R)/キリル文字(ISO-8859-5)/キリル文字(Windows 1251)・ギリシャ語(Windows-1253)/ギリシャ語(ISO-8859-7)・トルコ語(ISO-8859-9)・Unicode(UTF-8)/Unicode(UTF-7)・ユーザー定義から選ぶようになっていますが、実際に動くかどうかは分りません。HTML文書のヘッダー部分には、<META charset=>タグ(p.282参照)を上の多数の標準・慣用・Windowsコード(例えば、ロシア語ではISO-8859-5、KOI8-R、Windows 1251)から自動的に入れてくれます。FTPはComposerの1機能のような設計になっていて、Composerの出版(Publish)ボタンを押して起動できます。

Internet Explorer 4.0を標準インストールでなくて完全インストールで行なうと、HTMLエディタFrontPage Express(HTMLエディタFrontPageの機能限定ソフト)とFTPソフトWeb発行ウィザード(Web Publishing Wizard)もインストールされます。FrontPage ExpressはInternet Explorerの編集(Edit)ボタンでページ(Page)を、またはInternet ExplorerフォルダからFrontPage Expressを選び起動できます。基本的にWYSIWYGのエディタで、表示(View)--->オプション(Option)--->言語/フォントで選ばれた言語の文字でHTML文書を作ります。このフォントは英語/西ヨーロッパ語・他国語(UTF-8)・日本語(EUC)・日本語(Shift-JIS)・日本語(JIS)から選ぶようになっていますが、実際に動くかどうかは分りません。HTML文書のヘッダー部分には、<META charset=>タグ(p.282参照)を上の限られた標準・慣用・Windowsコード(ロシア語ではWindows 1251)から自動的に入れてくれます。Web発行ウィザードはInternet Explorerフォルダから別プログラムとして起動されます。Netscape CommunicatorおよびInternet Explorer 4.0の最低必要メモリは16MBで、推奨は32MB以上です。

7.6.6 翻訳辞書と翻訳ソフト
[p.237]:
「● Ergane(Windows)」の最後の行で
WindowsのWebページ(http://www.travlang.com/Ergane/)
[p.237〜239]: 「● Translation Manager 2.0」とその記述を削除して、p.238に日英翻訳の例文AとBとその英訳を追加し、
「● そのほか」(p.239)の第1パラグラフに次の記述を追加
最近英語、フランス語、ドイツ語、スペイン語、イタリア語から日本語に翻訳する「AILogic Translator 5か国語 for Windows」(エー・アイ・ロジック)が発売されましたので、この逆方向のソフトがあれば便利でしょう。VoiceXpressなどスピーチ製品で有名なラーナウト・ホスピー社(Lernout & Hauspie Speech Products N.V., Burlington, MA)は、Power Translator 6.0(英語<--->スペイン、フランス。ドイツ、イタリア語)などで有名なGlobalink社(Fairfax, VA)・Tsunami MT E-to-J & Typhoon MT J-to-Eなどで有名なNeocorTech社(San Diego, CA)・エー・アイ・ロジックを買収すると、'98年7月20日に発表しました

翻訳ソフトの分野は、現在その裾野が大きく広がっています。トランスレーション・マネージャー(Translation Manager、日本IBM、Windows版とOS/2版を付録CD-ROMに添付)は、企業内あるいはグループでの翻訳作業の管理に多く使われているもので、翻訳辞書は別売(学研から)としてまたはユーザ会社が用意して、用語の統一的使用、改訂が頻繁にある文書の作成などに便利です。こざいく/トランサー(COSAIC/Transer、ビジョン・コーポレーションおよびノヴァ)は、HTMLエディターに日英翻訳機能をもたせているもので、日本語Webページを作ったあと、英語Webページを有機的に作ろうというものです。また、WebAssistantバイリンガル・パック(東芝)には、Netscape CommunicatorとATRANSAC for Internet英日/日英V2.0(翻訳ソフト)とWebAssistant V3.0(HTMLエディター)が入っています。

機械翻訳関連ソフトウェア一覧(アジア太平洋機会翻訳協会)

7.6.7 OCRソフト
[p.239]
を新しい項目として、次の記述で追加
OCRソフトは印刷またはコンピュータでプリントアウトした活字をスキャナで撮り、コンピュータ用テキストに変えてくれます。OCRとはOptical Character Recognition(光学文字認識)の略で、通常文字認識をした後、文章チェックやスペルチェックをして認識率を高めます。新聞・雑誌・書籍を自由にコンピュータ用テキスト変えて無断でWebに載せることは著作権上できませんが、自社のパンフレットや資料をWebに載せたりする際には威力を発揮します。

日本語も英語も認識するOCRソフトには、Windows用の読んde!!ココ(エー・アイ・ソフト)、認識工房(ライオス・システム)、まるかじりバイリンガル(ノヴァ)、Autotype日英(亀島産業AI研究室、現在はエー・アイ・ロジックLernout & Hauspieの子会社)、宇宙字在(バーズ情報科学研究所)、読取革命(松下電器産業)、OmniPage Pro 6.0バイリンガル(ケア・ジャパン Caere Japan)、e.Typistバイリンガル(メディアドライブ)、OKReader(住友電工)など多数が販売されています。参照:OCRソフトの機能評価・比較のページ

TextBridge Pro(メディアドライブ)は11か国語(英語、イタリア語、オランダ語、スウェーデン語、スペイン語、デンマーク語、ドイツ語、ノルウェー語、フィンランド語、フランス語、ポルトガル語)が処理でき、WinReader Pro(同)は13か国語(上記言語とロシア語、日本語;業務用)、超整理er Ver.2.0(ノヴァ)は10か国語(日本語、英語、イタリア語、スウェーデン語、スペイン語、デンマーク語、ドイツ語、フィンランド語、フランス語、アイルランド語)、Presto!OCR Pro 4.0(エー・アイ・ソフト)は15か国語(英語、ドイツ語、フランス語、スペイン語、イタリア語、ポルトガル語、オランダ語、スウェ−デン語、ノルウェー語、デンマーク語、ポーランド語、フィンランド語、ギリシャ語、エストニア語、チェコ語;これら以外にもラテン文字表記の言語は認識可能だが、言語辞書による自動スペルチェックは機能しない、例えばハンガリー語、アイルランド語、リトアニア語、アルバニア語、トルコ語、カタロニア語、インドネシア語など;開発元は台湾のNewSoft Technology Corporation 力新国際科技)を扱えます。

韓国語は、韓国語/朝鮮語OCRソフト アルミ3.0高電社、ハングル・韓国漢字・英文・数字が混在した文書の文字を認識、文字の修正にはKorean Writer V3などが必要);韓国語/英語/日本語OCRソフト WINK OCR(シージーエス)。中国語は、清華OCRライト(クリエイト大阪)、中文起稿 Ver.2.3 OCR Plus(東京コンピュータサービス富士通ミドルウェア、認識可能フォントは簡宋体、簡倣宋、簡楷書、簡黒体、標題宋体;文字は記号および英数字(106文字)・漢字(GB2312-80の一級漢字3755文字および二級漢字のうち336文字))。参考までに通常日本語OCRソフトの文字認識は、明朝体・ゴシック体(・教科書体)マルチフォントで、漢字JIS第1水準(2,965文字)のうち全部、第2水準(3,384文字)のうち240文字(読んでde!!ココ)、420文字(e.Typistバイリンガル)、1032文字(リコーシステム開発の読み取り物語EV V3、認識は日本語文字のみ)、ひらがな・カタカナ・英文アルファベット・記号などで、総計3,600〜3,750文字くらいを認識すると宣伝されています。

Windows英語版または他国語版用には、WordScan Plus(Caere社、1996年にWordScanの開発・発売元Calera社を合併)、TextBridge(Xerox Imaging Systems社)、Recognita Plus(Recognita社、Caere社の子会社、ロシア語も処理)、Cuneiform(Cognitive Technology社、Russian/Ukrainian版あり)、CharacterEyes Pro V3.0(イスラエル・Ligature Ltd.)などがあります。ロシア語:ABBYY FineReader 4.0;中国語:丹青 4.0 黄金版(台湾・力新国際科技、英語名 Dan Ching 4.0 Chinese-English OCR by NewSoft Inc., USA)、清華文通 5.0(中国・北京市清華文通信息科技、英文名 TH-OCR by Tsinghua Wintone Information Technology)。ヘブライ語:Hebrew OCR (Ligature、業務用)、Otiot および Otiot Plus(Kotev Technology)。

Macintosh用には、OmniPage Pro(Caere社、日本ではヒューリンクスが販売)、TextBridge(Xerox Imaging Systems社)、WordScan Plus(Caere社)などが販売されています。[以上OCRソフトに関しては、千田大介・田辺哲、岡本昌巳、佐々木嗣也さんからも教えていただきました]

8章 各国語Webページの作成

[p.241]: この章では英語、スペイン語、中国語、アラビア語、ロシア語の5か国語で、Webページを作成しています。なぜ英語、中国語、ロシア語を選択したかは、十分理解できると思います。英語と中国語は使用人口からいっても大きな影響力があるし、ロシア語は我々の隣りの大国ロシアともとのソ連邦の主要言語です。なぜスペイン語とアラビア語かは、多少の説明が必要です。スペイン語は同様な言語処理を行なうフランス語、ドイツ語、スペイン語の中から、使用人口が多いので選びました。アラビア語は右から左へ書く言語であるアラビア語とヘブライ語の中から、日本ではユダヤ人および聖書を研究する人が欧米と比べて少なく、アラビア語を話す国との仕事上交流も多いという点から選びました。この本の英語版を作る際は、アラビア語に加えてヘブライ語も入れる必要があるかも知れません。隣国の韓国・朝鮮語も扱いたい、他の言葉もやってみたいという希望はあったのですが、ページ数に制限があり果たせませんでした。

8.1.3 英語版Webページの注意点
[p.246]:
■ イギリス英語の項に、次の注を追加
下にあるp.252の追加情報として、フランス語では「文章の中のコンマ(virgule)とピリオド(point、英国英語ではフルストップfull stop)はその直前の語にくっつけて置くが、コロンdeux-points(:)とセミコロンpoint-virgule(;)と疑問符point d'interrogation(?)と感嘆符point d'exclamation(!)については、直前の語との間にスペースを1つ置く」と書きましたが、実は1950年代までに英国で出版された英語の書籍も、ほとんどがこのルールを守っていました。例えば、ペンギン叢書(Penguin Classics、ロンドンのPenguin Books Ltd出版)の1950年代以前に出版された書籍がそうです。1960年代以降に米国向けも意識して編集された本はアメリカ式句読点法で、英語の句読点はすべて直前の語にくっつけて書く編集になっています。そこで私は前者を「the Traditional Anglo-French Punctuation Method」と呼び、後者である現在主流の方法を「the Modern American Punctuation Method」と呼ぶことにします。

[p.247]: 次の記述を追加
■ 英語の大文字と小文字

英語では見出しを大文字を使って書くことが多く、他の言語を使う国民に比べて大文字が大好きの国民です。これに比べて、フランス語などを使うラテン民族の新聞・雑誌などの見出しで大文字が比較的少ないのは、もともとラテン語が小文字でできていたという歴史的経緯からかも知れません。

我々日本人も比較的大文字には慣れていなくて、大文字は読みにくくて嫌いのようです。例えば、次のような大文字だけの表現

THE LANGUAGES OF THE WORLD BY COMPUTERS AND THE INTERNET
は、各語の始めの文字だけを大文字にしてあとは小文字で、次のように書くこともできます。
The Languages of the World by Computers and the Internet
この場合、始めの冠詞Theや名詞、動詞、形容詞、副詞はすべて始めの文字を大文字で書きますが、途中の冠詞the、前置詞with、接続詞andなどはすべて小文字で書くのが普通です。ですから、
The Languages Of The World By Computers And The Internet
とすべての単語の始めの文字を大文字で書くのは間違いではないと思いますが、多少不自然です。ただし例外があり、前置詞About、Throughなどや接続詞Althoughなどでも5文字以上の言葉は、こうして始めの文字を大文字で書くのが見栄えの点でよいことになっています。

注: 英語の書き方、英国英語と米国英語の違いなどは、3〜7頁、220〜224頁、245〜246頁、およびこれらの頁のここにある追加情報を参照すること。

8.2.3 スペイン語Webページの注意点
[p.249]:
例えばn〜、a'、...、逆?、逆!は、&ntilde;、&aacute;、...、&#191;(または&iquest;)、&#161;(または&iexcl;)と表記します。...欧文文字をサポートするHTMLエディタ(Netscape Navigator Gold英語版Adobe PageMill英語版など)を使えば、...

[p.252]: 注: 以上スペイン語(pp.249〜252)および英語(pp.220〜224とpp.245〜246)について述べたことは、フランス語、ドイツ語、イタリア語、ポルトガル語などの西欧語についても同様なことが言えると思います。参照:フランス語・ドイツ語・スペイン語ホームページの書き方」。ただし各国語によって微妙な差があります。

フランス語では、p.246の■ イギリス英語の項に書いた「Traditional Anglo-French Punctuation」方法により、文章の中のコンマ(virgule)とピリオド(point、英国英語ではフルストップfull stop)はその直前の語にくっつけて置きますが(英語でも同じ)、コロンdeux-points(:)とセミコロンpoint-virgule(;)と疑問符point d'interrogation(?)と感嘆符point d'exclamation(!)については、英語のやはりくっつけて書く仕方と違って、直前の語との間にスペースを1つ置きます。例として「Salut !」。さらにWeb上のHTMLで厳格な人は、単に「Salut !」ではなしに、ば感嘆符が画面の1番左へこないようにnon-breaking space (&nbsp;)を使って「Salut&nbsp;!」という書き方をします。フランス語の引用符ギュメguillemets(<<...>>、仏文では&#171;...&#187;と書く)の前後も1スペースあけますが、コンマまたはピリオドが閉じる引用符(>>、仏文では&#187;)の直後にくる時は1スペースはありません。残りのフランス語句読点、ダッシュ(ティレtiret---)と省略符(points de suspension...)は、Windows 3.1のコード表には追加されましたが(p.146のそれぞれ9Aと86)、ISO 8859-1 (p.140)にはないので、webには使わない方がいいでしょう。その他の符号、%やkgやF(フラン)またはFF(フランス・フラン)などについては特別なルールが出版界では定まっていないようですが、「70%」(soixante-dix pour cent)とくっつけて書くより、「70 %」または「70&nbsp;%」と離して書く方が多いようです。注:ただしスイス・フランス語では、L'Express誌オリンピック運動に見られるように、英語と同様な句読点方法を使ったりしているようです。

また「Plane`te Internet誌No.17の68ページ参照のこと」は「lire <i>Plan&egrave;te Internet</i> n&#186; 17 p. 68」と書きます。この&#186;は、oの下に_を書き、それを小さくして上の方に置く文字です(p.146の追加情報を参照)。以上、通常フランス人がHTML文書を作る時は、エディターまたはHTMLエディターに「Je vais A l'Ecole.」(ここでAは`a、Eは'e)とフランス・キーボードから直接文字を入力し(p.199〜200参照)、ファイルをセーブする時にHTMLエディターならNamed/Numbered Referenceを自動生成してくれます(p.249)。ギュメ(フランス語引用符)などのフランス・キーボードにない文字は、キーボード・マクロ(ある組み合わせのキーを押せば、あらかじめ定義しておいたある組み合わせの文字を生成してくれる機能)を使って特殊文字あるいはNamed/Numbered Referenceを生成してくれますが、もともとの入力が面倒なせいでしょうか現在webにはほとんど使われていません。なお、牡牛「boeuf」などに使われるoeを一緒にした文字(英語でoe ligatureという)はISO 8859-1(Latin 1文字セット)にはなく、新しくLatin 0文字セットでこの大文字・小文字が提案されていますが(p.140の追加情報を参照)、まだ決定・実装された訳ではないので、使えません。

英語では「$3,600.00」(US$3,600.00、(新)台湾ドルはNT$3,600.00 [NT=New Taiwan])または「£3,600.00」(HTMLでは&#163;)と書くと習いましたが、読む時は「three thousand six hundred dollars」などより「thirty-six hundred dollars」などという場合が多いので、実際には「$3600.00」と書かれる場合が多い。これに対して、フランス語の金額は「3,600フラン」を「3.600,00 F」(F=francs)と書けと教えられましたが、実際にはカンマをブランクにして、「3 600.00 F」またはHTMLでは特に「3&nbsp;600.00&nbsp;F」と書く場合が多い。また税別、税込の表記はそれぞれ「250 F HT」(hors taxe)、「250 F TTC」(toute taxes comprises)で、税金は通常消費税などで20.6%にもなりますから、フランスは税金天国地獄ですね。[以上フランス語の項は、パリのXavier Cazin、東京の伊藤敬子さん、その他の方々にも教えていただきました。]

ドイツ語では、a:、A、β(エス・ツェット)などをそれぞれ&auml;、&Auml;、&szlig;などとHTML文書では書いてゆきます。

8.3.3 中国語版Webページの注意点
[p.254]:
HyperEdit32(吉原伸介氏作、http://www.dicre.com)

図 8-16 中国語繁体字のHTML記述
[p.259]:
住所 ---> 地址

[p.260]: 次の2項目の記述を追加
■ 持-寺+并音(ピンイン)とWade-Gilesローマ字

中国語のローマ字としては、中華人民共和国成立後に制定された持-寺+并音(ピンイン)が現在は広く使われ、Beijing(北京)、Xian(西安)などと表記されてます。台湾ではWade-Gilesローマ字と呼ばれる表記方法が使われていて、台湾で発行されている辞書には注音字母とともに載っています。例えば、Taipei(台北、正確にはT'aipei、持-寺+并音ではTaibei)、Kaohsiung(高雄、持-寺+并音ではGaoxong)などと書きます。中国語Webページに発音や英語で注をつける場合には、こうした慣用的なローマ字にも留意しましょう。[注: 持-寺+并は中国独特の1つの文字です。]

■ 中国人の好み

中国人は赤が大好きです。赤はお祝いの色で、子供時代からから真っ赤な封筒(紅包、ホンパオ)に入ったお小遣いを親や親類からもらった思い出があるからです。黄色も大好きで、これは中国皇帝の色といわれています。もう1つ皇帝のシンボルとしては、龍(竜)があります。龍は唯一地上から天に昇れて、さらに地上に下り、天命を伝えることができます。龍はまた、玉を持って遊んでいる形でWebにもよくでてきます。この玉を龍が飲み込むと日蝕が起こり、中国のいい伝えでは人々は外に出てドラを鳴らして龍を驚かせて、玉を吐き出させて日蝕を終わらせます。龍と並んでよく見かけるのは鳳凰で、これは皇后または女帝のシンボルです。

中国人の大好きな花は梅(梅花、メイホァ)です。日本人の桜と韓国・朝鮮人のムクゲ(無窮花、韓国・朝鮮語でムグンホァ)と並んで有名な中国人の梅は、長い冬を耐え忍んだ後に春の始めにうっとりとした香りとともにきれいな花を咲かせるもので、アジアで初めての共和国である中華民国ができた(1912年)直後に国花に指定され、今でも台湾では国花的な扱いを受けています。ただし、現在の中国の国花は、中華人民共和国が成立した(1949年)後になって定められたボタン(牡丹花、モータンホァ)ですから、これも菊や芍薬や芙蓉などとともによくWebで見かけます。

8.4 アラビア語Webページを作成
[p.260]:
ここに以下を挿入(多少の誤りがあるかも知れない)
使用したシステム環境は次の通りです。

パソコン: IBM PC/AT互換機(自作) 
OS: Windows 95英語版とアラビア語版を別々の区画にイストール
ソフトウェア: 
  Internet Writer (テキスト・エディタ)
  Accent Multilingual Publisher (HTMLエディタ)
     注: 現在名Accent Global Author
  Netscape Navigator 3.0 (Webブラウザ)
  Sindbad (Netscape Navigator用のアラビア語処理アドオン・ソフト)

まず、日本語テキストをアラビア語に翻訳します。

  このWebページは...
   ...見ることができます。[このアラビア語訳をp.266からここに入れる]
アラビア語は中近東と北アフリカ諸国で国語として使われているだけでなく、全世界のイスラム教徒が聖典コーランの言葉として使っています。各地にアンミーヤ(Al Ammi-ya、民衆語)が発達していて、これらは戯曲や映画にも使われています。アラビア語教科書にはフスハー(Al Hus.h.a-、純粋語または正則語)と呼ばれる国際的共通語があるという説明をしていますが、上に示したのはむしろエジプトの日刊紙「アル・アハラム」や国連の公用語として使われているgenerally accepted written Arabicといった方がいいでしょう。[編集者へ: Ammi-yaのi-はiの上に-、Hus.h.a-のs.はsの下に.を置き、h.はhの下に.を置き、a-はaの上に-を置くこと]

アラビア語は、アリフ A 'Alif、バー B Ba-'、ター T Ta-'で始まるアラビア文字アルファベット28文字(ハムザ @ Hamzaなどはを含まず)とアラビア語独特の数字(西アフリカのマグレブ諸国では我々と同じ算用数字)を使います。アラビア語の書き順は通常右から左へ、途中アラビア語独特の数字やラテン文字があると左から右へ書き(手書きでは数字の最後の2桁は右から左へ)、各アルファベット文字は語の中での位置により初字、中間字、終字、独立字と変化します。句読点はハイフンという概念はなくて、その代りにDOSの時代には語内の各文字間を結ぶ横棒を適度の長さに延長したり(カシーダ Kashidaと呼ぶ)、WindowsとMacintoshの今日は各語間のスペースとアウトライン・フォントで調節しています。[編集者へ:Aはアラビア文字の'Alif(縦の棒)、BはBa-'(下向きの半月形の下に1つの点を置く)、TはTa-'(下向きの半月形の中に2つの点を横に並べる)です。Ba-'のa-はaの上に-、Ta-'のa-は同じく。@はファックスを見よ。]

アラビア語のキーボードは数種類の配列がありますが、IBM PC用のキーボードの配列が最も多く使われており、アリフ A、バー B、ター T はそれぞれアメリカ英語のH、F、Jキーの上にアサインされており(ヘブライ語のアレフ、ベート、ギメルはそれぞれT、C、Dの位置)、アラビア語入力モードへは通常右Alt-Shift(または右Ctrl-Shift)キーを同時に押して移り、ラテン文字入力モードへは左Alt-Shift(または左Ctrl-Shift)キーを同時に押して戻ります。アラビア語アルファベットは基本的に子音文字で、初心者用の母音符号(タシュキール、Tashki-l)は普通のテキストには使われませんが、初級読み物やコーランの引用に使われるためにアラビア語テキスト・エディタやワープロ・ソフトには、母音符号を入力してそのあと子音文字を入力するような母音符号処理機能も必ず入っています。[編集者へ:A、B)、Tは前のパラグラフを見よ。Tashki-lのi-はiの上に-を置く。]

アラビア語をパソコン処理するには、Windows 3.1用アラビア語環境ソフトSakhrがエジプトのAl Alamiah Electronics社のソフトウェア子会社Sakhr Softwareから提供され、多く利用されてきました。同社の95アラビア語用のInternet Writer(後述)でアラビア語テキストを処理するのも、現在では便利でしょう。これに対して、欧米ではWindows 3.1および95英語版で動くAccent Professional(Accent Software International社)、UniVerseおよびUniType(Gamma Productions社)なども使われています。

以下、Windows環境についてアラビア語Webの作り方を詳説しますが、Macintosh用には、Apple Computer社のArabic Language Kit(3.6章、p.152)がベースとなります。「The Arabic Mac and the Internet」(http://www.hf-fak.uib.no/institutter/ksv/arabnet.html)などを参考にするといいでしょう。

8.4.2 アラビア語Webページの表示
[p.265]:
Nick Bradburyが開発・販売していたHomeSiteは、現在はWeb作成プログラムCold Fusionも販売しているAllaire社のサイト(http://www.allaire.com)からダウンロードできます。

8.4.2 アラビア語Webページの注意点
[p.271]:
表8-1 アラビア語HTMLエディタに次を追加(p.281も参照のこと)
Tango Creator -- Alis Technologies社 -- Windows 95 -- 米国英語 -- ○ -- ○ -- ×

[p.272]: 「アラブ圏では色は緑を好み」に訂正。どうやら、オアシスから連想する緑が大好きでアラブ諸国の国旗にも大いに利用され、ジリジリ照付ける太陽とそこから連想される青色が嫌いで、夜の月と星が大好きのようです。[粕谷ゆういちさんのご指摘でした。著者の原稿にはあったものです]

8.7.1 Unicodeを使う方法
[p.280]:
ここにはTango Creator 2.5によるUnicodeページを作るやり方が記述してありますが、このホームページでp.158のUnicodeの追加情報にWindows 95のNetscape Composerなどを使って簡単に作る方法が書いてあります。

8.8 マルチリンガルWebページを広く告知する
[p.284]:
次の記述をNews Groupの記述があるパラグラフに追加

また、メーリング・リスト(mailing list)とは、インターネット上のあるサーバに会議参加者の名簿を登録しておき、参加者は誰でもそこに向けて電子メールを送るとそれが全参加者に送付されるという形式で、電子会議室を運営するものです。どんなメーリング・リストがあるかはやはり市販の各種ディレクトリの巻末にリストがありますし、言語関係のメーリング・リストのリストはList of Language-Related Mailing Lists(http://www.indigo.ie/egt/langlist.html、Bernard ComrieとMichael Everson両氏主催)などにありますので、利用してください。

Yahoo!は本書にある米国、カナダ、日本、英国&アイルランド、フランス、ドイツ版に次いで'97年11月現在、アジア(シンガポール)、オーストラリア&ニュージーランド、デンマーク、韓国、ノルウェー、スエーデン版が開設されています。

ページのトップへ戻る

番外部

まぼろしのコラム9 モデムのトラブルと海外旅行: 次の原稿は初稿にはコラム6としてあったのですが、まぼろしのように忽然と消えてしまいました! (実はこの本とはあまり関係のない「モデムのトラブル」という関根さんの原稿に、私が悪乗りして「海外旅行」の原稿を加えたもので、多少の参考になると思うのでこのに載せておきます。)
個人のインターネット利用にはモデムが不可欠です。ISDN回線ではTA(ターミナル・アダプタ)、LAN接続ではLANのサーバ側にモデムまたはTAが、ダイアルアップ接続する場合はモデムが必要になります。

しかし、モデムを利用する場合に、思いがけない落とし穴がありました。それはキャッチホンでした。キャッチホンにはキャッチホン1(月額300円)とキャッチホン2(月額500円)があります。インターネット・ユーザはキャッチホン2を選んでください。キャッチホン1では、インターネット接続中に他からの電話が入ると、接続が切れるだけでなく、最悪の場合でモデムが物理的に壊れることもあります。キャッチホンによる瞬間電流のために電圧が微妙に上がるためで、特に内蔵モデムやPCMCIA企画のPCカードが犠牲者になりやすいようです。キャッチホン2では、お話し中の場合に電話局のセンタにメーセージが録音できるので、キャッチホン1での問題はありません。ただし、録音されたメッセージを聞くには、各都道府県に1つしかないセンタを呼びだすので、多少電話料金がかさみます。

また、内蔵モデムの場合に、IRQ (Interrupt Request: DOSやWindowsで周辺機器がCPUに送る割り込み信号)の割り込み衝突に注意しましょう。衝突を起こすと、Windows 95は立ち上がらなくなります。起動デスクを使用してSYSTEM.INIとWIN.INIを手直しできるパワーユーザならともかく、ほとんどのユーザはWindows 95の再インストールが不可能になります。マウスがPS/2マウスならば(現在は大半のパソコンはPS/2マウスです)、モデムをCOM3に設定すればよいのですが、シリアルマウスを使用していてCOM1が占有されている場合は、BIOSでCOM2を無効にして、モデムをCOM2設定するのが無難です。

Windows 95では、plug & play (接続したカードの設定環境をOSが自動的に行なう) になって、とても便利になりました。リソース確保やIRQ割り込みも自動的に行なってくれるようになりました。ただし、plug & playの外付けモデムの電源をオフにして立ち上げると、いきなりsafe modeになる場合があります。この場合はモデムの電源を入れて、Windows 95を再起動すれば解決しますが、始めて体験するとびっくりします。画面上に「モデムの電源をいれてください」というメッセージが欲しいものです。Plug & playの道はなお険しいものがあります。

海外旅行でノート型パソコンを持ち歩き、現地のホテルや関連会社でパソコン通信やインターネットをする機会も多くなってきましたが、ここでよく憶えておかねばならないのは、電気通信法上はその国で許可を受けたモデムしか使えないことです。各国の電話回線と交換機の仕様に微妙な差があり、電話局として正常なデータ通信を保証できないという理由があるようです。しかし、この微妙な差も大して気にならなかったという経験の人がほとんどでしょう。

もっと大きな問題はモデム・ケーブルをつなげる壁側のプラグが、モジュラージャック(RJ-11)ではなくて、昔の直結式であったり、、オーストリアの例のようにユニークなソケット式であったりして、簡単に差し込めないことです。しかしながら、この問題も国際ホテルを中心にモジュラージャックに急速に改められています。例えば、韓国では壁側が直結で電話機側がモジュラージャックが多いので、メス・メス・プラグを持参して、電話機側でパソコンをつなぐと便利です。また、電話線の極性を調べるモデムセーバー(日本IBMが輸入販売、LaoxやT-Zoneなどで入手可)も販売されているので、クロスケーブルで日本のモデム向けに配線替えもできるようになりました。残る問題は世界の種々な電源用プラグと110/200/220/240ボルトの電圧にどう対処するかです。現代のマルチナショナル・モービル・コンピューティングを志す者は、100Vへの変換器と各種電源プラグ(双方とも旅行用品店で販売)、モデムセーバー、そして日本人独特の器用な手を持ち合わせて海外旅行することが必要です。

世界の電圧、電源プラグ世界の電話線用プラグ、これを英語でも確認

ページのトップへ戻る

Top Page in Japanese / Top Page in English


Addional Information to Part 3

The Multilingual Web Guide

Published by O'Reilly Japan

Move to the Japanese Part.

The following additional information is for a revised Japanese or translated foreign language edition.

Part 3: Creating the Multilingual Web Pages

Chapter 7. Preparations for Creating the Multilingual Web Pages
7.2.1 Considerations for Delivering the Web Pages to the World
[p. 224]:
Four items can be added from the Japanese text above.

Episode 7. Competition and Cooperation on the HTML Definitions
[p. 229]:
HyperText Markup Language 4.0 was officially adopted by W3C in Dec., 1997, as HTML 4.0 Recommendation, with Specification.

7.5 Graphics and Sound
[p.232]:
In order to minimize the slight differences in color of GIF and JPEG graphics files among the Windows, Macintosh and other client platforms, W3C agreed on the PNG (Portable Network Graphics) in October, 1996. According to Greg Roelofs' PNG Home Page, PNG is supported by Photoshop 4.0, Picture Publisher 7, etc., and by Netscape Navigator 4.04, Internet Explorer 4.0, and other browsers.

7.6.2 HTML Editors
[p. 234]:
Add:
HomeSite (Allaire, http://www.allaire.com)

Two paragraphs on Netscape Communicator's Composer and Internet Explorer 4.0's FrontPage Express that became available from July, 1997 (NC English version for Windows 95), to Feb. 1998 (IE4 for Macintosh Japanese version) can be added. (Refer also to the additional information to p. 166).

7.6.6 Translation Dictionaries and Translation Software
[p. 237]:
Move IBM Translation Manager on p. 237 to p. 239, with the description cited above in Japanese.

7.6.7 OCR Software
[p. 239]
Add 3 paragraphs about Optical Character Recognition (OCR) software.

Chapter 8. Creating Language Pages
[p. 241] Note: Created in this chapter are the Web pages from Japanese in five foreign languages: English, Spanish, Chinese, Arabic, and Russian. Why English, Chinese and Russian is easy to understand --- English and Chinese are two of the world's languages with the largest speaker populations, and Russian is spoken not only in the Russian Federation, Japan's next door neighbor, but also in the countries in and around the former U.S.S.R. Why Spanish and Arabic needs some explanations. Spanish was selected among the Western European langauges of French, German, etc., because it has the largest speaker population among them. Arabic was chosen as an example of the languages with the right-to-left writing systems, and because Japan's more interest in it compared to Hebrew --- Japan's Jewish population being almost nil and Chistian population less than one percent.

We wanted to add more languages here, such as Korean spoken in our next door neighbor, etc., but could not, because of limited space. The publishers of this book's translated editions, however, might want to add Japanese, Korean, Hebrew, etc. We remain upon their judgements.

8.2.3 Considerarions for Spanish Web Pages
[p. 249]:
Some corrections such as ñ, á, ..., ¿ and ¡ written as &ntilde;, &aacute;, ..., &#191; (or &iquest;), and &#161; (or &iexcl;). European language supporting HTML Editors such as Netscape Navigator Gold English version, Adobe PageMill English version, etc., can be used...

Two paragraphs on French language processing, written above in Japanese, can be used.

Figure 8-16 HTML Description in Traditional Chinese
[p. 259]:
The Chinese word for Address written here (zhu-4=suo-3) should be the same as in the Simplified Chinese HTML description on p. 257 (di-4=zhi-3). (In Japanese Shift-JIS, not "住所" which is its Japanese equivalent, but "地址")

8.3.3 Considerations for Chinese Web Pages [p.260]: Two more items can be added from the Japanese text above.

8.4 Creating Arabic Web Pages
[p. 260]:
Because this section is too much software-operation-centric, a 4-paragraph story is offered above in Japanese.

8.4.2 Considerations for Arabic Web Pages
[p. 271]:
Table 8-1 Arabic HTML Editors should include (refer to p. 281)
Tango Creator -- Alis Technologies -- Windows 95 -- U.S. English -- O -- O -- X

[p.272]: Correction to "The Arabs love the color of green." The Arabs seem to love the green color associated with the oases in the dessert, which is quite often used in their national flags, do not like the blue color associated with the sun during the day time, and fall in love with the moon and the stars at night. [Thanks to Yuichi Kasuya for this correction, which was actually in the authers' draft.]

8.7.1 Using Unicode
[p.280]:
In addition to Tango Creator 2.5 described here, see the additional information on p. 158 for using Netscape Communicator, Internet Explorer or other software to create Unicode web pages (UTF-8).

8.8 Publicizing Your Multilingual Web Pages
[p. 284]:
Add one paragraph from above about the Mailing Lists, and Bernard Comrie and Michael Everson's List of Language-Related Mailing Lists (http://www.indigo.ie/egt/langlist.html).

Extra Part

[p. 252]: Extra Episode: Modem Troubles and Overseas Trip. A 5-paragraph story which was never used for the Japanese edition.

Return to Top of Page Go to Conclusion

Top Page in Japanese / Top Page in English


Prepared by Yoshi Mikami. Created on July 25, 1997. Last update on Oct. 21, 1998.