DokuWiki

It's better when it's simple

ユーザ用ツール

サイト用ツール


ja:utf-8

UTF-8 エンコーディング

DokuWiki は現在、すべてのデータを UTF-8 で保存しています。データファイルのファイル名自体については、問題を避けるため保存時に URL エンコードしています。リリース 2005-02-06 以前のバージョンの DokuWiki では他のエンコード方式を使用していたため、DokuWiki のバージョンアップの際にデータファイルの再エンコードが必要となります。利用するエンコード方式を UTF-8 以外へ切り替えることは、サポートされていません

UTF-8 用の Web ブラウザの設定

すべてのモダンな Web ブラウザは UTF-8 エンコードされた Web ページを取り扱うことができます。これは、ほとんどの Web ブラウザで実際に期待通り動作する数少ない機能のひとつです。もし Web ブラウザでいくつかの文字が正しく表示されない場合は、おそらく Unicode にきちんと対応したフォントが足りないものと考えられます。

Windows ユーザはマイクロソフトによる Arialuni.TTF フォントをインストールすべきです。このフォントは Microsoft Office スイートに含まれています。

Debian ユーザが Unicode フォントを正しくインストールする方法としては、私のフォントに関するページが参考になります。

ファイルの編集

Notepad 2 で BOM 無しで保存

データファイルを直接編集する意向がある場合、もしくは翻訳を作成したい場合は、UTF-8 を認識できるエディタを使用する必要があります。世の中には対応したエディタがたくさんありますが、もしあなたがまだエディタを決めていないのであれば、私は以下に挙げる通り、小さく、シンプルで、無料のエディタを 2 つお勧めしたいと思います1)

  • TEA – GTK2 ベースのエディタ (GNU/Linux 向け)
  • Notepad2 – メモ帳の非常に良い置き換えソフト (Windows 向け)

注意: DokuWiki はバイトオーダーマーク (BOM)使用しませんので、エディタでも絶対に BOM を付けないようにしてください (特に PHP スクリプトと設定ファイルの編集時)。

バッチ処理によるファイルのエンコード

  • Unix では、iconv (http://www.gnu.org/software/libiconv/) を使用してください。
  • Windows では、recode (iconv の移植版、http://recode.progiciels-bpi.ca/archives) を使用してください。
    • フランス語圏のローカルマシン上での簡単な変換例は、以下のようになります。
      recode lat1..u8 test.txt 

      ここで、lat1 は変換前の文字コード、u8 は変換後の文字コード (UTF-8) となります。

    • Windows 上でバッチ処理変換を行うには、サブディレクトリ内のファイルをすべて変換する以下のコードを利用してください。
      FOR /F "tokens=*" %%G IN ('dir/b/S/X ^"C:\yourpath\*.txt^"') DO recode -v lat1..u8 %%~sG
  • 更なる情報は、このリンクを参照してください。

Web ブラウザでのチェック用として、以下に UTF-8 で記述された文字の例を示します2)

星座記号: ♈ ♉ ♊ ♋ ♌ ♍ ♎ ♏ ♐ ♑ ♒ ♓

チェス盤:

A B C D E F G H
8
7
6
5
4
3
2
1

ロシア語:

По оживлённым берегам
Громады стройные теснятся
Дворцов и башен; корабли
Толпой со всех концов земли
К богатым пристаням стремятся;

古代ギリシア語:

Αρχαίο Πνεύμα Αθάνατον!  
Ἰοὺ ἰού· τὰ πάντʼ ἂν ἐξήκοι σαφῆ.
Ὦ φῶς, τελευταῖόν σε προσϐλέψαιμι νῦν,
ὅστις πέφασμαι φύς τʼ ἀφʼ ὧν οὐ χρῆν, ξὺν οἷς τʼ
οὐ χρῆν ὁμιλῶν, οὕς τέ μʼ οὐκ ἔδει κτανών.

現代ギリシア語:

Η σύγχρονη Ελλάδα, έχει να παρουσιάσει δυναμικό
έργο στον τομέα του πολιτισμού, των τεχνών και
των γραμμάτων. Αντίστοιχα δυναμική είναι η παρουσία
των Ελλήνων επιχειρηματιών στην διεθνή οικονομική
και βιομηχανική σκηνή.

サンスクリット語:

पशुपतिरपि तान्यहानि कृच्छ्राद्
अगमयदद्रिसुतासमागमोत्कः । 
कमपरमवशं न विप्रकुर्युर्
विभुमपि तं यदमी स्पृशन्ति भावाः ॥

ヒンディー語:

गूगल समाचार हिन्दी में 

韓国語:

한글은 아름다운 우리글입니다.
곱고 아름답게 사용하는 것이 우리의 의무입니다.

中国語 (繁体字):

子曰:「學而時習之,不亦說乎?有朋自遠方來,不亦樂乎?
人不知而不慍,不亦君子乎?」

有子曰:「其為人也孝弟,而好犯上者,鮮矣;
不好犯上,而好作亂者,未之有也。君子務本,本立而道生。
孝弟也者,其為仁之本與!」

日本語:

「秋の田の かりほの庵の 苫をあらみ わが衣手は 露にぬれつつ」 天智天皇
「春すぎて 夏来にけらし 白妙の 衣ほすてふ 天の香具山」 持統天皇
「あしびきの 山鳥の尾の しだり尾の ながながし夜を ひとりかも寝む」 柿本人麻呂 

ラトビア語:

Iedomu jaukie ideāli,
Vecākie principi, tikla, mīla - 
Dienas allažības priekšā
Šķīst kā graudi akmeņstarpā.
Glāžšķūņa rūķīši jautri dziedādami čiepj koncertflīģeļa vāku. 

中国語 (簡体字):

这是简体字汉语。 zhè shì jiǎn t zì hàn yǔ 

アルメニア語:

Հարգանքներիս հավաստիքը Հայ Ժողովրդին:
Ամենալավ օրենքները չեն օգնի, եթե մարդիկ բանի պետք չեն:

ヘブライ語:

המשפט עם הזכוכית שאפשר לאכול בלי שזה מפריע, לא זוכר איך הוא הולך
1)
これを Unicode 対応エディタの完全なリストにするつもりはありませんし、利用可能なベストの選択肢を示すつもりもありません。これらは単純に私が気に入ったというだけの 2 つの小さなエディタとなります。ここに他のエディタを追加しないようにしてください
ja/utf-8.txt · 最終更新: 2009-12-14 13:26 by kazmiya

特に明示されていない限り、本Wikiの内容は次のライセンスに従います: CC Attribution-Share Alike 4.0 International
CC Attribution-Share Alike 4.0 International Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki