Java

サポートされているエンコーディング

java.io.InputStreamReader、java.io.OutputStreamWriter、および java.lang.String クラスを使用すると、Unicode とその他のいくつかの文字エンコーディング間の変換を行うことができます。サポートされるエンコーディングは、Java 2 Platform の実装によって異なります。エンコーディングの一覧と、サポートに必要な Java 2 Platform, Standard Edition, v1.3 の各実装は、java.lang パッケージの仕様を参照してください。この仕様で使われているエンコーディング名は、Sun の実装で使われている標準のエンコーディング名と異なっていることがあります。これらのエンコーディング名は、別名機構を使ってサポートされます。US-ASCII は ASCII に、ISO-8859-1 は ISO8859_1 に、UTF-8 は UTF8 に、UTF-16BE は UnicodeBigUnmarked に、UTF-16LE は UnicodeLittleUnmarked にマッピングされます。

Sun の Java 2 Software Development Kit, Standard Edition, v. 1.3 の Windows 版または Solaris 版、および Java 2 Runtime Environment, Standard Edition, v. 1.3 の Solaris 版では、このページに示すエンコーディングがすべてサポートされています。Sun の Java 2 Runtime Environment, Standard Edition, v. 1.3 の Windows 版には、米国語版と国際化版があります。米国語版では、最初の表に示すエンコーディングだけがサポートされています。国際化版 (lib/i18n.jar ファイルを含む) では、このページに示すエンコーディングがすべてサポートされています。

基本エンコーディングセット (rt.jar に含まれる)

標準名

解説

ASCII

American Standard Code for Information Interchange

Cp1252

Windows ラテン文字-1

ISO8859_1

ISO 8859-1、ラテンアルファベット No. 1

UnicodeBig

16 ビット Unicode Transformation Format、ビッグエンディアンバイト順、バイト順マーク付き

UnicodeBigUnmarked

16 ビット Unicode Transformation Format、ビッグエンディアンバイト順

UnicodeLittle

16 ビット Unicode Transformation Format、リトルエンディアンバイト順、バイト順マーク付き

UnicodeLittleUnmarked

16 ビット Unicode Transformation Format、リトルエンディアンバイト順

UTF8

8 ビット Unicode Transformation Format

UTF-16

16 ビット Unicode Transformation Format、必須の初期バイト順マークによって指定されたバイト順

拡張エンコーディングセット (i18n.jar に含まれる)

標準名

解説

Big5

Big5、中国語 (繁体字)

Cp037

米国、カナダ (2 か国語、フランス語)、オランダ、 ポルトガル、ブラジル、オーストラリア

Cp273

IBM オーストリア、ドイツ

Cp277

IBM デンマーク、ノルウェー

Cp278

IBM フィンランド、スウェーデン

Cp280

IBM イタリア

Cp284

IBM カタロニア語/スペイン、スペイン語圏ラテンアメリカ

Cp285

IBM 英国、アイルランド

Cp297

IBM フランス

Cp420

IBM アラビア語

Cp424

IBM ヘブライ語

Cp437

MS-DOS 米国、オーストラリア、ニュージーランド、南アフリカ

Cp500

EBCDIC 500V1

Cp737

PC ギリシャ文字

Cp775

PC バルト諸語

Cp838

IBM タイ拡張 SBCS

Cp850

MS-DOS ラテン文字-1

Cp852

MS-DOS ラテン文字-2

Cp855

IBM キリル文字

Cp856

IBM ヘブライ語

Cp857

IBM トルコ語

Cp858

Cp850 の拡張でユーロ文字を含む

Cp860

MS-DOS ポルトガル語

Cp861

MS-DOS アイスランド語

Cp862

PC ヘブライ語

Cp863

MS-DOS カナダ系フランス語

Cp864

PC アラビア語

Cp865

MS-DOS 北欧

Cp866

MS-DOS ロシア語

Cp868

MS-DOS パキスタン

Cp869

IBM 近代ギリシャ語

Cp870

IBM 多言語ラテン文字-2

Cp871

IBM アイスランド

Cp874

IBM タイ

Cp875

IBM ギリシャ語

Cp918

IBM パキスタン (ウルドゥー語)

Cp921

IBM ラトビア、リトアニア (AIX、DOS)

Cp922

IBM エストニア (AIX、DOS)

Cp930

UDC 4370 文字を含む日本語カタカナ漢字、5026 のスーパーセット

Cp933

UDC 1880 文字を含む韓国語、5029 のスーパーセット

Cp935

UDC 1880 文字を含む簡体字中国語ホスト、5031 のスーパーセット

Cp937

UDC 6204 文字を含む繁体字中国語ホスト、5033 のスーパーセット

Cp939

UDC 4370 文字を含む日本語ラテン文字漢字、5035 のスーパーセット

Cp942

IBM OS/2 日本語、Cp932 のスーパーセット

Cp942C

Cp942 の拡張

Cp943

IBM OS/2 日本語、Cp932 および Shift-JIS のスーパーセット

Cp943C

Cp943 の拡張

Cp948

OS/2 中国語 (台湾)、938 のスーパーセット

Cp949

PC 韓国語

Cp949C

Cp949 の拡張

Cp950

PC 中国語 (香港、台湾)

Cp964

AIX 中国語 (台湾)

Cp970

AIX 韓国語

Cp1006

IBM AIX パキスタン (ウルドゥー語)

Cp1025

IBM 多言語キリル文字: ブルガリア、ボスニア、ヘルツェゴビナ、マケドニア (旧ユーゴスラビアマケドニア共和国)

Cp1026

IBM ラテン文字-5、トルコ

Cp1046

IBM アラビア語 - Windows

Cp1097

IBM イラン (現代ペルシャ語)/ペルシャ語

Cp1098

IBM イラン (現代ペルシャ語)/ペルシャ語 (PC)

Cp1112

IBM ラトビア、リトアニア

Cp1122

IBM エストニア

Cp1123

IBM ウクライナ

Cp1124

IBM AIX ウクライナ

Cp1140

Cp037 の拡張でユーロ文字を含む

Cp1141

Cp273 の拡張でユーロ文字を含む

Cp1142

Cp277 の拡張でユーロ文字を含む

Cp1143

Cp278 の拡張でユーロ文字を含む

Cp1144

Cp280 の拡張でユーロ文字を含む

Cp1145

Cp284 の拡張でユーロ文字を含む

Cp1146

Cp285 の拡張でユーロ文字を含む

Cp1147

Cp297 の拡張でユーロ文字を含む

Cp1148

Cp500 の拡張でユーロ文字を含む

Cp1149

Cp871 の拡張でユーロ文字を含む

Cp1250

Windows 東欧

Cp1251

Windows キリル文字

Cp1253

Windows ギリシャ文字

Cp1254

Windows トルコ語

Cp1255

Windows ヘブライ語

Cp1256

Windows アラビア語

Cp1257

Windows バルト諸語

Cp1258

Windows ベトナム語

Cp1381

IBM OS/2、DOS 中国 (中華人民共和国)

Cp1383

IBM AIX 中国 (中華人民共和国)

Cp33722

IBM-eucJP - 日本語 (5050 のスーパーセット)

EUC_CN

GB2312、EUC エンコーディング、中国語 (簡体字)

EUC_JP

JIS X 0201、0208、0212、EUC エンコーディング、日本語

EUC_KR

KS C 5601、EUC エンコーディング、韓国語

EUC_TW

CNS11643 (Plane 1-3)、EUC エンコーディング、中国語 (繁体字)

GBK

GBK、中国語 (簡体字)

ISO2022CN

ISO 2022 CN、中国語 (Unicode への変換のみ)

ISO2022CN_CNS

ISO 2022 CN 形式の CNS 11643、繁体字中国語 (Unicode からの変換のみ)

ISO2022CN_GB

ISO 2022 CN 形式の GB 2312、簡体字中国語 (Unicode からの変換のみ)

ISO2022JP

JIS X 0201、ISO 2022 形式の 0208、日本語

ISO2022KR

ISO 2022 KR、韓国語

ISO8859_2

ISO 8859-2、ラテンアルファベット No. 2

ISO8859_3

ISO 8859-3、ラテンアルファベット No. 3

ISO8859_4

ISO 8859-4、ラテンアルファベット No. 4

ISO8859_5

ISO 8859-5、ラテン/キリル文字アルファベット

ISO8859_6

ISO 8859-6、ラテン/アラビア文字アルファベット

ISO8859_7

ISO 8859-7、ラテン/ギリシャ文字アルファベット

ISO8859_8

ISO 8859-8、ラテン/ヘブライ語アルファベット

ISO8859_9

ISO 8859-9、ラテンアルファベット No. 5

ISO8859_13

ISO 8859-13、ラテンアルファベット No. 7

ISO8859_15_FDIS

ISO 8859-15、ラテンアルファベット No. 9

JIS0201

JIS X 0201、日本語

JIS0208

JIS X 0208、日本語

JIS0212

JIS X 0212、日本語

JISAutoDetect

Shift-JIS、EUC-JP、ISO 2022 JP の検出および変換 (Unicode への変換のみ)

Johab

Johab、韓国語

KOI8_R

KOI8-R、ロシア語

MS874

Windows タイ語

MS932

Windows 日本語

MS936

Windows 簡体字中国語

MS949

Windows 韓国語

MS950

Windows 繁体字中国語

MacArabic

Macintosh アラビア語

MacCentralEurope

Macintosh ラテン文字-2

MacCroatian

Macintosh クロアチア語

MacCyrillic

Macintosh キリル文字

MacDingbat

Macintosh Dingbat

MacGreek

Macintosh ギリシャ語

MacHebrew

Macintosh ヘブライ語

MacIceland

Macintosh アイスランド語

MacRoman

Macintosh Roman

MacRomania

Macintosh ルーマニア

MacSymbol

Macintosh シンボル

MacThai

Macintosh タイ

MacTurkish

Macintosh トルコ語

MacUkraine

Macintosh ウクライナ

SJIS

Shift-JIS、日本語

TIS620

TIS620、タイ


Copyright © 1996-99 Sun Microsystems, Inc. All Rights Reserved.

Contact us

Sun
Java ソフトウェア