|
|
java.io.InputStreamReader、java.io.OutputStreamWriter、および java.lang.String クラスを使用すると、Unicode とその他のいくつかの文字エンコーディング間の変換を行うことができます。サポートされるエンコーディングは、Java 2 Platform の実装によって異なります。エンコーディングの一覧と、サポートに必要な Java 2 Platform, Standard Edition, v1.3 の各実装は、java.lang パッケージの仕様を参照してください。この仕様で使われているエンコーディング名は、Sun の実装で使われている標準のエンコーディング名と異なっていることがあります。これらのエンコーディング名は、別名機構を使ってサポートされます。US-ASCII は ASCII に、ISO-8859-1 は ISO8859_1 に、UTF-8 は UTF8 に、UTF-16BE は UnicodeBigUnmarked に、UTF-16LE は UnicodeLittleUnmarked にマッピングされます。
Sun の Java 2 Software Development Kit, Standard Edition, v. 1.3 の Windows 版または Solaris 版、および Java 2 Runtime Environment, Standard Edition, v. 1.3 の Solaris 版では、このページに示すエンコーディングがすべてサポートされています。Sun の Java 2 Runtime Environment, Standard Edition, v. 1.3 の Windows 版には、米国語版と国際化版があります。米国語版では、最初の表に示すエンコーディングだけがサポートされています。国際化版 (lib/i18n.jar ファイルを含む) では、このページに示すエンコーディングがすべてサポートされています。
標準名 |
解説 |
---|---|
ASCII |
American Standard Code for Information Interchange |
Cp1252 |
Windows ラテン文字-1 |
ISO8859_1 |
ISO 8859-1、ラテンアルファベット No. 1 |
UnicodeBig |
16 ビット Unicode Transformation Format、ビッグエンディアンバイト順、バイト順マーク付き |
UnicodeBigUnmarked |
16 ビット Unicode Transformation Format、ビッグエンディアンバイト順 |
UnicodeLittle |
16 ビット Unicode Transformation Format、リトルエンディアンバイト順、バイト順マーク付き |
UnicodeLittleUnmarked |
16 ビット Unicode Transformation Format、リトルエンディアンバイト順 |
UTF8 |
8 ビット Unicode Transformation Format |
UTF-16 |
16 ビット Unicode Transformation Format、必須の初期バイト順マークによって指定されたバイト順 |
標準名 |
解説 |
---|---|
Big5 |
Big5、中国語 (繁体字) |
Cp037 |
米国、カナダ (2 か国語、フランス語)、オランダ、 ポルトガル、ブラジル、オーストラリア |
Cp273 |
IBM オーストリア、ドイツ |
Cp277 |
IBM デンマーク、ノルウェー |
Cp278 |
IBM フィンランド、スウェーデン |
Cp280 |
IBM イタリア |
Cp284 |
IBM カタロニア語/スペイン、スペイン語圏ラテンアメリカ |
Cp285 |
IBM 英国、アイルランド |
Cp297 |
IBM フランス |
Cp420 |
IBM アラビア語 |
Cp424 |
IBM ヘブライ語 |
Cp437 |
MS-DOS 米国、オーストラリア、ニュージーランド、南アフリカ |
Cp500 |
EBCDIC 500V1 |
Cp737 |
PC ギリシャ文字 |
Cp775 |
PC バルト諸語 |
Cp838 |
IBM タイ拡張 SBCS |
Cp850 |
MS-DOS ラテン文字-1 |
Cp852 |
MS-DOS ラテン文字-2 |
Cp855 |
IBM キリル文字 |
Cp856 |
IBM ヘブライ語 |
Cp857 |
IBM トルコ語 |
Cp858 |
Cp850 の拡張でユーロ文字を含む |
Cp860 |
MS-DOS ポルトガル語 |
Cp861 |
MS-DOS アイスランド語 |
Cp862 |
PC ヘブライ語 |
Cp863 |
MS-DOS カナダ系フランス語 |
Cp864 |
PC アラビア語 |
Cp865 |
MS-DOS 北欧 |
Cp866 |
MS-DOS ロシア語 |
Cp868 |
MS-DOS パキスタン |
Cp869 |
IBM 近代ギリシャ語 |
Cp870 |
IBM 多言語ラテン文字-2 |
Cp871 |
IBM アイスランド |
Cp874 |
IBM タイ |
Cp875 |
IBM ギリシャ語 |
Cp918 |
IBM パキスタン (ウルドゥー語) |
Cp921 |
IBM ラトビア、リトアニア (AIX、DOS) |
Cp922 |
IBM エストニア (AIX、DOS) |
Cp930 |
UDC 4370 文字を含む日本語カタカナ漢字、5026 のスーパーセット |
Cp933 |
UDC 1880 文字を含む韓国語、5029 のスーパーセット |
Cp935 |
UDC 1880 文字を含む簡体字中国語ホスト、5031 のスーパーセット |
Cp937 |
UDC 6204 文字を含む繁体字中国語ホスト、5033 のスーパーセット |
Cp939 |
UDC 4370 文字を含む日本語ラテン文字漢字、5035 のスーパーセット |
Cp942 |
IBM OS/2 日本語、Cp932 のスーパーセット |
Cp942C |
Cp942 の拡張 |
Cp943 |
IBM OS/2 日本語、Cp932 および Shift-JIS のスーパーセット |
Cp943C |
Cp943 の拡張 |
Cp948 |
OS/2 中国語 (台湾)、938 のスーパーセット |
Cp949 |
PC 韓国語 |
Cp949C |
Cp949 の拡張 |
Cp950 |
PC 中国語 (香港、台湾) |
Cp964 |
AIX 中国語 (台湾) |
Cp970 |
AIX 韓国語 |
Cp1006 |
IBM AIX パキスタン (ウルドゥー語) |
Cp1025 |
IBM 多言語キリル文字: ブルガリア、ボスニア、ヘルツェゴビナ、マケドニア (旧ユーゴスラビアマケドニア共和国) |
Cp1026 |
IBM ラテン文字-5、トルコ |
Cp1046 |
IBM アラビア語 - Windows |
Cp1097 |
IBM イラン (現代ペルシャ語)/ペルシャ語 |
Cp1098 |
IBM イラン (現代ペルシャ語)/ペルシャ語 (PC) |
Cp1112 |
IBM ラトビア、リトアニア |
Cp1122 |
IBM エストニア |
Cp1123 |
IBM ウクライナ |
Cp1124 |
IBM AIX ウクライナ |
Cp1140 |
Cp037 の拡張でユーロ文字を含む |
Cp1141 |
Cp273 の拡張でユーロ文字を含む |
Cp1142 |
Cp277 の拡張でユーロ文字を含む |
Cp1143 |
Cp278 の拡張でユーロ文字を含む |
Cp1144 |
Cp280 の拡張でユーロ文字を含む |
Cp1145 |
Cp284 の拡張でユーロ文字を含む |
Cp1146 |
Cp285 の拡張でユーロ文字を含む |
Cp1147 |
Cp297 の拡張でユーロ文字を含む |
Cp1148 |
Cp500 の拡張でユーロ文字を含む |
Cp1149 |
Cp871 の拡張でユーロ文字を含む |
Cp1250 |
Windows 東欧 |
Cp1251 |
Windows キリル文字 |
Cp1253 |
Windows ギリシャ文字 |
Cp1254 |
Windows トルコ語 |
Cp1255 |
Windows ヘブライ語 |
Cp1256 |
Windows アラビア語 |
Cp1257 |
Windows バルト諸語 |
Cp1258 |
Windows ベトナム語 |
Cp1381 |
IBM OS/2、DOS 中国 (中華人民共和国) |
Cp1383 |
IBM AIX 中国 (中華人民共和国) |
Cp33722 |
IBM-eucJP - 日本語 (5050 のスーパーセット) |
EUC_CN |
GB2312、EUC エンコーディング、中国語 (簡体字) |
EUC_JP |
JIS X 0201、0208、0212、EUC エンコーディング、日本語 |
EUC_KR |
KS C 5601、EUC エンコーディング、韓国語 |
EUC_TW |
CNS11643 (Plane 1-3)、EUC エンコーディング、中国語 (繁体字) |
GBK |
GBK、中国語 (簡体字) |
ISO2022CN |
ISO 2022 CN、中国語 (Unicode への変換のみ) |
ISO2022CN_CNS |
ISO 2022 CN 形式の CNS 11643、繁体字中国語 (Unicode からの変換のみ) |
ISO2022CN_GB |
ISO 2022 CN 形式の GB 2312、簡体字中国語 (Unicode からの変換のみ) |
ISO2022JP |
JIS X 0201、ISO 2022 形式の 0208、日本語 |
ISO2022KR |
ISO 2022 KR、韓国語 |
ISO8859_2 |
ISO 8859-2、ラテンアルファベット No. 2 |
ISO8859_3 |
ISO 8859-3、ラテンアルファベット No. 3 |
ISO8859_4 |
ISO 8859-4、ラテンアルファベット No. 4 |
ISO8859_5 |
ISO 8859-5、ラテン/キリル文字アルファベット |
ISO8859_6 |
ISO 8859-6、ラテン/アラビア文字アルファベット |
ISO8859_7 |
ISO 8859-7、ラテン/ギリシャ文字アルファベット |
ISO8859_8 |
ISO 8859-8、ラテン/ヘブライ語アルファベット |
ISO8859_9 |
ISO 8859-9、ラテンアルファベット No. 5 |
ISO8859_13 |
ISO 8859-13、ラテンアルファベット No. 7 |
ISO8859_15_FDIS |
ISO 8859-15、ラテンアルファベット No. 9 |
JIS0201 |
JIS X 0201、日本語 |
JIS0208 |
JIS X 0208、日本語 |
JIS0212 |
JIS X 0212、日本語 |
JISAutoDetect |
Shift-JIS、EUC-JP、ISO 2022 JP の検出および変換 (Unicode への変換のみ) |
Johab |
Johab、韓国語 |
KOI8_R |
KOI8-R、ロシア語 |
MS874 |
Windows タイ語 |
MS932 |
Windows 日本語 |
MS936 |
Windows 簡体字中国語 |
MS949 |
Windows 韓国語 |
MS950 |
Windows 繁体字中国語 |
MacArabic |
Macintosh アラビア語 |
MacCentralEurope |
Macintosh ラテン文字-2 |
MacCroatian |
Macintosh クロアチア語 |
MacCyrillic |
Macintosh キリル文字 |
MacDingbat |
Macintosh Dingbat |
MacGreek |
Macintosh ギリシャ語 |
MacHebrew |
Macintosh ヘブライ語 |
MacIceland |
Macintosh アイスランド語 |
MacRoman |
Macintosh Roman |
MacRomania |
Macintosh ルーマニア |
MacSymbol |
Macintosh シンボル |
MacThai |
Macintosh タイ |
MacTurkish |
Macintosh トルコ語 |
MacUkraine |
Macintosh ウクライナ |
SJIS |
Shift-JIS、日本語 |
TIS620 |
TIS620、タイ |
Copyright © 1996-99 Sun Microsystems, Inc. All Rights Reserved. |
|