サポートされているエンコーディング

Java

サポートされているエンコーディング

java.io.InputStreamReader、java.io.OutputStreamWriter、および java.lang.String クラスを使用すると、Unicode とその他のいくつかの文字エンコーディング間の変換を行うことができます。サポートされるエンコーディングは、Java 2 Platform の実装によって異なります。エンコーディングの一覧と、サポートに必要な Java 2 Platform, Standard Edition, v1.3 の各実装は、java.lang パッケージの仕様を参照してください。この仕様で使われているエンコーディング名は、Sun の実装で使われている標準のエンコーディング名と異なっていることがあります。これらのエンコーディング名は、別名機構を使ってサポートされます。US-ASCII は ASCII に、ISO-8859-1 は ISO8859_1 に、UTF-8 は UTF8 に、UTF-16BE は UnicodeBigUnmarked に、UTF-16LE は UnicodeLittleUnmarked にマッピングされます。

Sun の Java 2 Software Development Kit, Standard Edition, v. 1.3 の Windows 版または Solaris 版、および Java 2 Runtime Environment, Standard Edition, v. 1.3 の Solaris 版では、このページに示すエンコーディングがすべてサポートされています。Sun の Java 2 Runtime Environment, Standard Edition, v. 1.3 の Windows 版には、米国語版と国際化版があります。米国語版では、最初の表に示すエンコーディングだけがサポートされています。国際化版 (lib/i18n.jar ファイルを含む) では、このページに示すエンコーディングがすべてサポートされています。

基本エンコーディングセット (rt.jar に含まれる)

標準名

解説

ASCII

American Standard Code for Information Interchange

Cp1252

Windows ラテン文字-1

ISO8859_1

ISO 8859-1、ラテンアルファベット No. 1

UnicodeBig

16 ビット Unicode Transformation Format、ビッグエンディアンバイト順、バイト順マーク付き

UnicodeBigUnmarked

16 ビット Unicode Transformation Format、ビッグエンディアンバイト順

UnicodeLittle

16 ビット Unicode Transformation Format、リトルエンディアンバイト順、バイト順マーク付き

UnicodeLittleUnmarked

16 ビット Unicode Transformation Format、リトルエンディアンバイト順

UTF8

8 ビット Unicode Transformation Format

UTF-16

16 ビット Unicode Transformation Format、必須の初期バイト順マークによって指定されたバイト順

標準名	解説
ASCII	American Standard Code for Information Interchange
Cp1252	Windows ラテン文字-1
ISO8859_1	ISO 8859-1、ラテンアルファベット No. 1
UnicodeBig	16 ビット Unicode Transformation Format、ビッグエンディアンバイト順、バイト順マーク付き
UnicodeBigUnmarked	16 ビット Unicode Transformation Format、ビッグエンディアンバイト順
UnicodeLittle	16 ビット Unicode Transformation Format、リトルエンディアンバイト順、バイト順マーク付き
UnicodeLittleUnmarked	16 ビット Unicode Transformation Format、リトルエンディアンバイト順
UTF8	8 ビット Unicode Transformation Format
UTF-16	16 ビット Unicode Transformation Format、必須の初期バイト順マークによって指定されたバイト順

拡張エンコーディングセット (i18n.jar に含まれる)

標準名

解説

Big5

Big5、中国語 (繁体字)

Cp037

米国、カナダ (2 か国語、フランス語)、オランダ、ポルトガル、ブラジル、オーストラリア

Cp273

IBM オーストリア、ドイツ

Cp277

IBM デンマーク、ノルウェー

Cp278

IBM フィンランド、スウェーデン

Cp280

IBM イタリア

Cp284

IBM カタロニア語/スペイン、スペイン語圏ラテンアメリカ

Cp285

IBM 英国、アイルランド

Cp297

IBM フランス

Cp420

IBM アラビア語

Cp424

IBM ヘブライ語

Cp437

MS-DOS 米国、オーストラリア、ニュージーランド、南アフリカ

Cp500

EBCDIC 500V1

Cp737

PC ギリシャ文字

Cp775

PC バルト諸語

Cp838

IBM タイ拡張 SBCS

Cp850

MS-DOS ラテン文字-1

Cp852

MS-DOS ラテン文字-2

Cp855

IBM キリル文字

Cp856

IBM ヘブライ語

Cp857

IBM トルコ語

Cp858

Cp850 の拡張でユーロ文字を含む

Cp860

MS-DOS ポルトガル語

Cp861

MS-DOS アイスランド語

Cp862

PC ヘブライ語

Cp863

MS-DOS カナダ系フランス語

Cp864

PC アラビア語

Cp865

MS-DOS 北欧

Cp866

MS-DOS ロシア語

Cp868

MS-DOS パキスタン

Cp869

IBM 近代ギリシャ語

Cp870

IBM 多言語ラテン文字-2

Cp871

IBM アイスランド

Cp874

IBM タイ

Cp875

IBM ギリシャ語

Cp918

IBM パキスタン (ウルドゥー語)

Cp921

IBM ラトビア、リトアニア (AIX、DOS)

Cp922

IBM エストニア (AIX、DOS)

Cp930

UDC 4370 文字を含む日本語カタカナ漢字、5026 のスーパーセット

Cp933

UDC 1880 文字を含む韓国語、5029 のスーパーセット

Cp935

UDC 1880 文字を含む簡体字中国語ホスト、5031 のスーパーセット

Cp937

UDC 6204 文字を含む繁体字中国語ホスト、5033 のスーパーセット

Cp939

UDC 4370 文字を含む日本語ラテン文字漢字、5035 のスーパーセット

Cp942

IBM OS/2 日本語、Cp932 のスーパーセット

Cp942C

Cp942 の拡張

Cp943

IBM OS/2 日本語、Cp932 および Shift-JIS のスーパーセット

Cp943C

Cp943 の拡張

Cp948

OS/2 中国語 (台湾)、938 のスーパーセット

Cp949

PC 韓国語

Cp949C

Cp949 の拡張

Cp950

PC 中国語 (香港、台湾)

Cp964

AIX 中国語 (台湾)

Cp970

AIX 韓国語

Cp1006

IBM AIX パキスタン (ウルドゥー語)

Cp1025

IBM 多言語キリル文字: ブルガリア、ボスニア、ヘルツェゴビナ、マケドニア (旧ユーゴスラビアマケドニア共和国)

Cp1026

IBM ラテン文字-5、トルコ

Cp1046

IBM アラビア語 - Windows

Cp1097

IBM イラン (現代ペルシャ語)/ペルシャ語

Cp1098

IBM イラン (現代ペルシャ語)/ペルシャ語 (PC)

Cp1112

IBM ラトビア、リトアニア

Cp1122

IBM エストニア

Cp1123

IBM ウクライナ

Cp1124

IBM AIX ウクライナ

Cp1140

Cp037 の拡張でユーロ文字を含む

Cp1141

Cp273 の拡張でユーロ文字を含む

Cp1142

Cp277 の拡張でユーロ文字を含む

Cp1143

Cp278 の拡張でユーロ文字を含む

Cp1144

Cp280 の拡張でユーロ文字を含む

Cp1145

Cp284 の拡張でユーロ文字を含む

Cp1146

Cp285 の拡張でユーロ文字を含む

Cp1147

Cp297 の拡張でユーロ文字を含む

Cp1148

Cp500 の拡張でユーロ文字を含む

Cp1149

Cp871 の拡張でユーロ文字を含む

Cp1250

Windows 東欧

Cp1251

Windows キリル文字

Cp1253

Windows ギリシャ文字

Cp1254

Windows トルコ語

Cp1255

Windows ヘブライ語

Cp1256

Windows アラビア語

Cp1257

Windows バルト諸語

Cp1258

Windows ベトナム語

Cp1381

IBM OS/2、DOS 中国 (中華人民共和国)

Cp1383

IBM AIX 中国 (中華人民共和国)

Cp33722

IBM-eucJP - 日本語 (5050 のスーパーセット)

EUC_CN

GB2312、EUC エンコーディング、中国語 (簡体字)

EUC_JP

JIS X 0201、0208、0212、EUC エンコーディング、日本語

EUC_KR

KS C 5601、EUC エンコーディング、韓国語

EUC_TW

CNS11643 (Plane 1-3)、EUC エンコーディング、中国語 (繁体字)

GBK

GBK、中国語 (簡体字)

ISO2022CN

ISO 2022 CN、中国語 (Unicode への変換のみ)

ISO2022CN_CNS

ISO 2022 CN 形式の CNS 11643、繁体字中国語 (Unicode からの変換のみ)

ISO2022CN_GB

ISO 2022 CN 形式の GB 2312、簡体字中国語 (Unicode からの変換のみ)

ISO2022JP

JIS X 0201、ISO 2022 形式の 0208、日本語

ISO2022KR

ISO 2022 KR、韓国語

ISO8859_2

ISO 8859-2、ラテンアルファベット No. 2

ISO8859_3

ISO 8859-3、ラテンアルファベット No. 3

ISO8859_4

ISO 8859-4、ラテンアルファベット No. 4

ISO8859_5

ISO 8859-5、ラテン/キリル文字アルファベット

ISO8859_6

ISO 8859-6、ラテン/アラビア文字アルファベット

ISO8859_7

ISO 8859-7、ラテン/ギリシャ文字アルファベット

ISO8859_8

ISO 8859-8、ラテン/ヘブライ語アルファベット

ISO8859_9

ISO 8859-9、ラテンアルファベット No. 5

ISO8859_13

ISO 8859-13、ラテンアルファベット No. 7

ISO8859_15_FDIS

ISO 8859-15、ラテンアルファベット No. 9

JIS0201

JIS X 0201、日本語

JIS0208

JIS X 0208、日本語

JIS0212

JIS X 0212、日本語

JISAutoDetect

Shift-JIS、EUC-JP、ISO 2022 JP の検出および変換 (Unicode への変換のみ)

Johab

Johab、韓国語

KOI8_R

KOI8-R、ロシア語

MS874

Windows タイ語

MS932

Windows 日本語

MS936

Windows 簡体字中国語

MS949

Windows 韓国語

MS950

Windows 繁体字中国語

MacArabic

Macintosh アラビア語

MacCentralEurope

Macintosh ラテン文字-2

MacCroatian

Macintosh クロアチア語

MacCyrillic

Macintosh キリル文字

MacDingbat

Macintosh Dingbat

MacGreek

Macintosh ギリシャ語

MacHebrew

Macintosh ヘブライ語

MacIceland

Macintosh アイスランド語

MacRoman

Macintosh Roman

MacRomania

Macintosh ルーマニア

MacSymbol

Macintosh シンボル

MacThai

Macintosh タイ

MacTurkish

Macintosh トルコ語

MacUkraine

Macintosh ウクライナ

SJIS

Shift-JIS、日本語

TIS620

TIS620、タイ

標準名	解説
Big5	Big5、中国語 (繁体字)
Cp037	米国、カナダ (2 か国語、フランス語)、オランダ、ポルトガル、ブラジル、オーストラリア
Cp273	IBM オーストリア、ドイツ
Cp277	IBM デンマーク、ノルウェー
Cp278	IBM フィンランド、スウェーデン
Cp280	IBM イタリア
Cp284	IBM カタロニア語/スペイン、スペイン語圏ラテンアメリカ
Cp285	IBM 英国、アイルランド
Cp297	IBM フランス
Cp420	IBM アラビア語
Cp424	IBM ヘブライ語
Cp437	MS-DOS 米国、オーストラリア、ニュージーランド、南アフリカ
Cp500	EBCDIC 500V1
Cp737	PC ギリシャ文字
Cp775	PC バルト諸語
Cp838	IBM タイ拡張 SBCS
Cp850	MS-DOS ラテン文字-1
Cp852	MS-DOS ラテン文字-2
Cp855	IBM キリル文字
Cp856	IBM ヘブライ語
Cp857	IBM トルコ語
Cp858	Cp850 の拡張でユーロ文字を含む
Cp860	MS-DOS ポルトガル語
Cp861	MS-DOS アイスランド語
Cp862	PC ヘブライ語
Cp863	MS-DOS カナダ系フランス語
Cp864	PC アラビア語
Cp865	MS-DOS 北欧
Cp866	MS-DOS ロシア語
Cp868	MS-DOS パキスタン
Cp869	IBM 近代ギリシャ語
Cp870	IBM 多言語ラテン文字-2
Cp871	IBM アイスランド
Cp874	IBM タイ
Cp875	IBM ギリシャ語
Cp918	IBM パキスタン (ウルドゥー語)
Cp921	IBM ラトビア、リトアニア (AIX、DOS)
Cp922	IBM エストニア (AIX、DOS)
Cp930	UDC 4370 文字を含む日本語カタカナ漢字、5026 のスーパーセット
Cp933	UDC 1880 文字を含む韓国語、5029 のスーパーセット
Cp935	UDC 1880 文字を含む簡体字中国語ホスト、5031 のスーパーセット
Cp937	UDC 6204 文字を含む繁体字中国語ホスト、5033 のスーパーセット
Cp939	UDC 4370 文字を含む日本語ラテン文字漢字、5035 のスーパーセット
Cp942	IBM OS/2 日本語、Cp932 のスーパーセット
Cp942C	Cp942 の拡張
Cp943	IBM OS/2 日本語、Cp932 および Shift-JIS のスーパーセット
Cp943C	Cp943 の拡張
Cp948	OS/2 中国語 (台湾)、938 のスーパーセット
Cp949	PC 韓国語
Cp949C	Cp949 の拡張
Cp950	PC 中国語 (香港、台湾)
Cp964	AIX 中国語 (台湾)
Cp970	AIX 韓国語
Cp1006	IBM AIX パキスタン (ウルドゥー語)
Cp1025	IBM 多言語キリル文字: ブルガリア、ボスニア、ヘルツェゴビナ、マケドニア (旧ユーゴスラビアマケドニア共和国)
Cp1026	IBM ラテン文字-5、トルコ
Cp1046	IBM アラビア語 - Windows
Cp1097	IBM イラン (現代ペルシャ語)/ペルシャ語
Cp1098	IBM イラン (現代ペルシャ語)/ペルシャ語 (PC)
Cp1112	IBM ラトビア、リトアニア
Cp1122	IBM エストニア
Cp1123	IBM ウクライナ
Cp1124	IBM AIX ウクライナ
Cp1140	Cp037 の拡張でユーロ文字を含む
Cp1141	Cp273 の拡張でユーロ文字を含む
Cp1142	Cp277 の拡張でユーロ文字を含む
Cp1143	Cp278 の拡張でユーロ文字を含む
Cp1144	Cp280 の拡張でユーロ文字を含む
Cp1145	Cp284 の拡張でユーロ文字を含む
Cp1146	Cp285 の拡張でユーロ文字を含む
Cp1147	Cp297 の拡張でユーロ文字を含む
Cp1148	Cp500 の拡張でユーロ文字を含む
Cp1149	Cp871 の拡張でユーロ文字を含む
Cp1250	Windows 東欧
Cp1251	Windows キリル文字
Cp1253	Windows ギリシャ文字
Cp1254	Windows トルコ語
Cp1255	Windows ヘブライ語
Cp1256	Windows アラビア語
Cp1257	Windows バルト諸語
Cp1258	Windows ベトナム語
Cp1381	IBM OS/2、DOS 中国 (中華人民共和国)
Cp1383	IBM AIX 中国 (中華人民共和国)
Cp33722	IBM-eucJP - 日本語 (5050 のスーパーセット)
EUC_CN	GB2312、EUC エンコーディング、中国語 (簡体字)
EUC_JP	JIS X 0201、0208、0212、EUC エンコーディング、日本語
EUC_KR	KS C 5601、EUC エンコーディング、韓国語
EUC_TW	CNS11643 (Plane 1-3)、EUC エンコーディング、中国語 (繁体字)
GBK	GBK、中国語 (簡体字)
ISO2022CN	ISO 2022 CN、中国語 (Unicode への変換のみ)
ISO2022CN_CNS	ISO 2022 CN 形式の CNS 11643、繁体字中国語 (Unicode からの変換のみ)
ISO2022CN_GB	ISO 2022 CN 形式の GB 2312、簡体字中国語 (Unicode からの変換のみ)
ISO2022JP	JIS X 0201、ISO 2022 形式の 0208、日本語
ISO2022KR	ISO 2022 KR、韓国語
ISO8859_2	ISO 8859-2、ラテンアルファベット No. 2
ISO8859_3	ISO 8859-3、ラテンアルファベット No. 3
ISO8859_4	ISO 8859-4、ラテンアルファベット No. 4
ISO8859_5	ISO 8859-5、ラテン/キリル文字アルファベット
ISO8859_6	ISO 8859-6、ラテン/アラビア文字アルファベット
ISO8859_7	ISO 8859-7、ラテン/ギリシャ文字アルファベット
ISO8859_8	ISO 8859-8、ラテン/ヘブライ語アルファベット
ISO8859_9	ISO 8859-9、ラテンアルファベット No. 5
ISO8859_13	ISO 8859-13、ラテンアルファベット No. 7
ISO8859_15_FDIS	ISO 8859-15、ラテンアルファベット No. 9
JIS0201	JIS X 0201、日本語
JIS0208	JIS X 0208、日本語
JIS0212	JIS X 0212、日本語
JISAutoDetect	Shift-JIS、EUC-JP、ISO 2022 JP の検出および変換 (Unicode への変換のみ)
Johab	Johab、韓国語
KOI8_R	KOI8-R、ロシア語
MS874	Windows タイ語
MS932	Windows 日本語
MS936	Windows 簡体字中国語
MS949	Windows 韓国語
MS950	Windows 繁体字中国語
MacArabic	Macintosh アラビア語
MacCentralEurope	Macintosh ラテン文字-2
MacCroatian	Macintosh クロアチア語
MacCyrillic	Macintosh キリル文字
MacDingbat	Macintosh Dingbat
MacGreek	Macintosh ギリシャ語
MacHebrew	Macintosh ヘブライ語
MacIceland	Macintosh アイスランド語
MacRoman	Macintosh Roman
MacRomania	Macintosh ルーマニア
MacSymbol	Macintosh シンボル
MacThai	Macintosh タイ
MacTurkish	Macintosh トルコ語
MacUkraine	Macintosh ウクライナ
SJIS	Shift-JIS、日本語
TIS620	TIS620、タイ

Java ソフトウェア