jdk-sandbox: test/jdk/sun/nio/cs/ISCIITest.java@664b9d44db74 (annotated)

796 2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	1	/*
5506 202f599c92aa 6943119: Rebrand source copyright notices ohair parents: 796 diff changeset	2	* Copyright (c) 2008, Oracle and/or its affiliates. All rights reserved.
796 2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	3	* DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	4	*
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	5	* This code is free software; you can redistribute it and/or modify it
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	6	* under the terms of the GNU General Public License version 2 only, as
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	7	* published by the Free Software Foundation.
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	8	*
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	9	* This code is distributed in the hope that it will be useful, but WITHOUT
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	10	* ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	11	* FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	12	* version 2 for more details (a copy is included in the LICENSE file that
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	13	* accompanied this code).
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	14	*
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	15	* You should have received a copy of the GNU General Public License version
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	16	* 2 along with this work; if not, write to the Free Software Foundation,
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	17	* Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301 USA.
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	18	*
5506 202f599c92aa 6943119: Rebrand source copyright notices ohair parents: 796 diff changeset	19	* Please contact Oracle, 500 Oracle Parkway, Redwood Shores, CA 94065 USA
202f599c92aa 6943119: Rebrand source copyright notices ohair parents: 796 diff changeset	20	* or visit www.oracle.com if you need additional information or have any
202f599c92aa 6943119: Rebrand source copyright notices ohair parents: 796 diff changeset	21	* questions.
796 2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	22	*/
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	23
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	24	/* @test
44115 bb4e971bf5d4 8176195: Fix misc module dependencies in jdk_core tests xiaofeya parents: 5506 diff changeset	25	* @bug 4328178
bb4e971bf5d4 8176195: Fix misc module dependencies in jdk_core tests xiaofeya parents: 5506 diff changeset	26	* @summary Performs baseline and regression test on the ISCII91 charset
bb4e971bf5d4 8176195: Fix misc module dependencies in jdk_core tests xiaofeya parents: 5506 diff changeset	27	* @modules jdk.charsets
796 2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	28	*/
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	29
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	30	import java.io.*;
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	31
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	32	public class ISCIITest {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	33
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	34	private static void failureReport() {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	35	System.err.println ("Failed ISCII91 Regression Test");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	36	}
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	37
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	38	private static void mapEquiv(int start,
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	39	int end,
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	40	String testName)
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	41	throws Exception
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	42	{
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	43	byte[] singleByte = new byte[1];
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	44	byte[] encoded = new byte[1];
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	45
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	46	for (int i = start; i <= end; i++ ) {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	47	singleByte[0] = (byte) i;
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	48	try {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	49	String unicodeStr =
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	50	new String (singleByte,"ISCII91");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	51
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	52	if (i != (int)unicodeStr.charAt(0)) {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	53	System.err.println ("FAILED ISCII91 Regression test"
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	54	+ "input byte is " + i );
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	55	throw new Exception("");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	56	}
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	57	encoded = unicodeStr.getBytes("ISCII91");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	58
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	59	if (encoded[0] != singleByte[0]) {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	60	System.err.println("Encoding error " + testName);
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	61	throw new Exception("Failed ISCII91 Regression test");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	62	}
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	63
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	64	} catch (UnsupportedEncodingException e) {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	65	failureReport();
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	66	}
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	67	}
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	68	return;
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	69	}
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	70
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	71	private static void checkUnmapped(int start,
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	72	int end,
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	73	String testName)
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	74	throws Exception {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	75
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	76	byte[] singleByte = new byte[1];
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	77
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	78	for (int i = start; i <= end; i++ ) {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	79	singleByte[0] = (byte) i;
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	80	try {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	81	String unicodeStr = new String (singleByte, "ISCII91");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	82
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	83	if (unicodeStr.charAt(0) != '\uFFFD') {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	84	System.err.println("FAILED " + testName +
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	85	"input byte is " + i );
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	86	throw new Exception ("Failed ISCII91 regression test");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	87	}
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	88	} catch (UnsupportedEncodingException e) {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	89	System.err.println("Unsupported character encoding");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	90	}
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	91	}
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	92	return;
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	93	}
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	94
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	95	/*
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	96	*
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	97	*/
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	98	private static void checkRange(int start, int end,
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	99	char[] expectChars,
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	100	String testName)
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	101	throws Exception {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	102	byte[] singleByte = new byte[1];
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	103	byte[] encoded = new byte[1];
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	104	int lookupOffset = 0;
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	105
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	106	for (int i=start; i <= end; i++ ) {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	107	singleByte[0] = (byte) i;
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	108	String unicodeStr = new String (singleByte, "ISCII91");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	109	if (unicodeStr.charAt(0) != expectChars[lookupOffset++]) {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	110	throw new Exception ("Failed ISCII91 Regression Test");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	111	}
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	112	encoded = unicodeStr.getBytes("ISCII");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	113	}
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	114	return;
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	115	}
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	116
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	117	/*
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	118	* Tests the ISCII91 Indic character encoding
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	119	* as per IS 13194:1991 Bureau of Indian Standards.
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	120	*/
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	121
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	122	private static void test () throws Exception {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	123
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	124	try {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	125
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	126
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	127	// ISCII91 is an 8-byte encoding which retains the ASCII
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	128	// mappings in the lower half.
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	129
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	130	mapEquiv(0, 0x7f, "7 bit ASCII range");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	131
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	132	// Checks a range of characters which are unmappable according
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	133	// to the standards.
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	134
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	135	checkUnmapped(0x81, 0x9f, "UNMAPPED");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	136
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	137	// Vowel Modifier chars can be used to modify the vowel
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	138	// sound of the preceding consonant, vowel or matra character.
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	139
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	140	byte[] testByte = new byte[1];
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	141	char[] vowelModChars = {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	142	'\u0901', // Vowel modifier Chandrabindu
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	143	'\u0902', // Vowel modifier Anuswar
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	144	'\u0903' // Vowel modifier Visarg
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	145	};
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	146
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	147	checkRange(0xa1, 0xa3, vowelModChars, "INDIC VOWEL MODIFIER CHARS");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	148
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	149	char[] expectChars = {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	150	'\u0905', // a4 -- Vowel A
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	151	'\u0906', // a5 -- Vowel AA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	152	'\u0907', // a6 -- Vowel I
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	153	'\u0908', // a7 -- Vowel II
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	154	'\u0909', // a8 -- Vowel U
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	155	'\u090a', // a9 -- Vowel UU
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	156	'\u090b', // aa -- Vowel RI
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	157	'\u090e', // ab -- Vowel E ( Southern Scripts )
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	158	'\u090f', // ac -- Vowel EY
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	159	'\u0910', // ad -- Vowel AI
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	160	'\u090d', // ae -- Vowel AYE ( Devanagari Script )
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	161	'\u0912', // af -- Vowel O ( Southern Scripts )
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	162	'\u0913', // b0 -- Vowel OW
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	163	'\u0914', // b1 -- Vowel AU
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	164	'\u0911', // b2 -- Vowel AWE ( Devanagari Script )
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	165	};
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	166
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	167	checkRange(0xa4, 0xb2, expectChars, "INDIC VOWELS");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	168
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	169	char[] expectConsChars =
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	170	{
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	171	'\u0915', // b3 -- Consonant KA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	172	'\u0916', // b4 -- Consonant KHA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	173	'\u0917', // b5 -- Consonant GA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	174	'\u0918', // b6 -- Consonant GHA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	175	'\u0919', // b7 -- Consonant NGA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	176	'\u091a', // b8 -- Consonant CHA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	177	'\u091b', // b9 -- Consonant CHHA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	178	'\u091c', // ba -- Consonant JA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	179	'\u091d', // bb -- Consonant JHA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	180	'\u091e', // bc -- Consonant JNA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	181	'\u091f', // bd -- Consonant Hard TA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	182	'\u0920', // be -- Consonant Hard THA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	183	'\u0921', // bf -- Consonant Hard DA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	184	'\u0922', // c0 -- Consonant Hard DHA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	185	'\u0923', // c1 -- Consonant Hard NA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	186	'\u0924', // c2 -- Consonant Soft TA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	187	'\u0925', // c3 -- Consonant Soft THA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	188	'\u0926', // c4 -- Consonant Soft DA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	189	'\u0927', // c5 -- Consonant Soft DHA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	190	'\u0928', // c6 -- Consonant Soft NA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	191	'\u0929', // c7 -- Consonant NA ( Tamil )
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	192	'\u092a', // c8 -- Consonant PA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	193	'\u092b', // c9 -- Consonant PHA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	194	'\u092c', // ca -- Consonant BA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	195	'\u092d', // cb -- Consonant BHA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	196	'\u092e', // cc -- Consonant MA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	197	'\u092f', // cd -- Consonant YA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	198	'\u095f', // ce -- Consonant JYA ( Bengali, Assamese & Oriya )
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	199	'\u0930', // cf -- Consonant RA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	200	'\u0931', // d0 -- Consonant Hard RA ( Southern Scripts )
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	201	'\u0932', // d1 -- Consonant LA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	202	'\u0933', // d2 -- Consonant Hard LA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	203	'\u0934', // d3 -- Consonant ZHA ( Tamil & Malayalam )
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	204	'\u0935', // d4 -- Consonant VA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	205	'\u0936', // d5 -- Consonant SHA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	206	'\u0937', // d6 -- Consonant Hard SHA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	207	'\u0938', // d7 -- Consonant SA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	208	'\u0939', // d8 -- Consonant HA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	209	};
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	210
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	211	checkRange(0xb3, 0xd8, expectConsChars, "INDIC CONSONANTS");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	212
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	213	char[] matraChars = {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	214	'\u093e', // da -- Vowel Sign AA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	215	'\u093f', // db -- Vowel Sign I
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	216	'\u0940', // dc -- Vowel Sign II
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	217	'\u0941', // dd -- Vowel Sign U
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	218	'\u0942', // de -- Vowel Sign UU
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	219	'\u0943', // df -- Vowel Sign RI
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	220	'\u0946', // e0 -- Vowel Sign E ( Southern Scripts )
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	221	'\u0947', // e1 -- Vowel Sign EY
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	222	'\u0948', // e2 -- Vowel Sign AI
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	223	'\u0945', // e3 -- Vowel Sign AYE ( Devanagari Script )
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	224	'\u094a', // e4 -- Vowel Sign O ( Southern Scripts )
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	225	'\u094b', // e5 -- Vowel Sign OW
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	226	'\u094c', // e6 -- Vowel Sign AU
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	227	'\u0949' // e7 -- Vowel Sign AWE ( Devanagari Script )
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	228	};
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	229
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	230	// Matras or Vowel signs alter the implicit
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	231	// vowel sound associated with an Indic consonant.
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	232
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	233	checkRange(0xda, 0xe7, matraChars, "INDIC MATRAS");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	234
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	235	char[] loneContextModifierChars = {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	236	'\u094d', // e8 -- Vowel Omission Sign ( Halant )
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	237	'\u093c', // e9 -- Diacritic Sign ( Nukta )
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	238	'\u0964' // ea -- Full Stop ( Viram, Northern Scripts )
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	239	};
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	240
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	241	checkRange(0xe8, 0xea,
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	242	loneContextModifierChars, "LONE INDIC CONTEXT CHARS");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	243
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	244
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	245	// Test Indic script numeral chars
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	246	// (as opposed to international numerals)
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	247
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	248	char[] expectNumeralChars =
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	249	{
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	250	'\u0966', // f1 -- Digit 0
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	251	'\u0967', // f2 -- Digit 1
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	252	'\u0968', // f3 -- Digit 2
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	253	'\u0969', // f4 -- Digit 3
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	254	'\u096a', // f5 -- Digit 4
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	255	'\u096b', // f6 -- Digit 5
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	256	'\u096c', // f7 -- Digit 6
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	257	'\u096d', // f8 -- Digit 7
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	258	'\u096e', // f9 -- Digit 8
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	259	'\u096f' // fa -- Digit 9
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	260	};
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	261
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	262	checkRange(0xf1, 0xfa,
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	263	expectNumeralChars, "NUMERAL/DIGIT CHARACTERS");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	264	int lookupOffset = 0;
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	265
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	266	char[] expectNuktaSub = {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	267	'\u0950',
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	268	'\u090c',
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	269	'\u0961',
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	270	'\u0960',
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	271	'\u0962',
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	272	'\u0963',
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	273	'\u0944',
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	274	'\u093d'
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	275	};
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	276
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	277	/*
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	278	* ISCII uses a number of code extension techniques
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	279	* to access a number of lesser used characters.
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	280	* The Nukta character which ordinarily signifies
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	281	* a diacritic is used in combination with existing
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	282	* characters to escape them to a different character.
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	283	* value.
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	284	*/
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	285
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	286	byte[] codeExtensionBytes = {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	287	(byte)0xa1 , (byte)0xe9, // Chandrabindu + Nukta
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	288	// =>DEVANAGARI OM SIGN
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	289	(byte)0xa6 , (byte)0xe9, // Vowel I + Nukta
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	290	// => DEVANAGARI VOCALIC L
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	291	(byte)0xa7 , (byte)0xe9, // Vowel II + Nukta
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	292	// => DEVANAGARI VOCALIC LL
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	293	(byte)0xaa , (byte)0xe9, // Vowel RI + Nukta
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	294	// => DEVANAGARI VOCALIC RR
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	295	(byte)0xdb , (byte)0xe9, // Vowel sign I + Nukta
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	296	// => DEVANAGARI VOWEL SIGN VOCALIC L
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	297	(byte)0xdc , (byte)0xe9, // Vowel sign II + Nukta
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	298	// => DEVANAGARI VOWEL SIGN VOCALIC LL
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	299
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	300	(byte)0xdf , (byte)0xe9, // Vowel sign Vocalic R + Nukta
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	301	// => DEVANAGARI VOWEL SIGN VOCALIC RR
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	302	(byte)0xea , (byte)0xe9 // Full stop/Phrase separator + Nukta
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	303	// => DEVANAGARI SIGN AVAGRAHA
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	304	};
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	305
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	306	lookupOffset = 0;
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	307	byte[] bytePair = new byte[2];
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	308
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	309	for (int i=0; i < (codeExtensionBytes.length)/2; i++ ) {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	310	bytePair[0] = (byte) codeExtensionBytes[lookupOffset++];
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	311	bytePair[1] = (byte) codeExtensionBytes[lookupOffset++];
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	312
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	313	String unicodeStr = new String (bytePair,"ISCII91");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	314	if (unicodeStr.charAt(0) != expectNuktaSub[i]) {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	315	throw new Exception("Failed Nukta Sub");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	316	}
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	317	}
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	318
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	319	lookupOffset = 0;
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	320	byte[] comboBytes = {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	321	(byte)0xe8 , (byte)0xe8, //HALANT + HALANT
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	322	(byte)0xe8 , (byte)0xe9 //HALANT + NUKTA aka. Soft Halant
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	323	};
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	324	char[] expectCombChars = {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	325	'\u094d',
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	326	'\u200c',
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	327	'\u094d',
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	328	'\u200d'
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	329	};
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	330
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	331	for (int i=0; i < (comboBytes.length)/2; i++ ) {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	332	bytePair[0] = (byte) comboBytes[lookupOffset++];
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	333	bytePair[1] = (byte) comboBytes[lookupOffset];
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	334	String unicodeStr = new String (bytePair, "ISCII91");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	335	if (unicodeStr.charAt(0) != expectCombChars[lookupOffset-1]
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	336	&& unicodeStr.charAt(1) != expectCombChars[lookupOffset]) {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	337	throw new Exception("Failed ISCII91 Regression Test");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	338	}
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	339	lookupOffset++;
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	340	}
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	341
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	342	} catch (UnsupportedEncodingException e) {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	343	System.err.println ("ISCII91 encoding not supported");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	344	throw new Exception ("Failed ISCII91 Regression Test");
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	345	}
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	346	}
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	347
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	348	public static void main (String[] args) throws Exception {
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	349	test();
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	350	}
2c3db720c065 6675856: Open charset tests sherman parents: diff changeset	351	}

author	jiangli
	Wed, 27 Sep 2017 17:55:20 -0400
changeset 47548	664b9d44db74
parent 47216	71c04702a3d5
permissions	-rw-r--r--