tools/cldr-code/src/test/java/org/unicode/cldr/unittest/TestTransforms.java - platform/external/cldr - Git at Google

 package org.unicode.cldr.unittest;

 import java.io.BufferedReader;
 import java.io.File;
 import java.io.IOException;
 import java.util.ArrayList;
 import java.util.Arrays;
 import java.util.Collection;
 import java.util.Enumeration;
 import java.util.HashMap;
 import java.util.HashSet;
 import java.util.List;
 import java.util.Locale;
 import java.util.Map;
 import java.util.Set;
 import java.util.TreeSet;
 import java.util.regex.Matcher;
 import java.util.regex.Pattern;

 import org.unicode.cldr.draft.FileUtilities;
 import org.unicode.cldr.util.CLDRConfig;
 import org.unicode.cldr.util.CLDRFile;
 import org.unicode.cldr.util.CLDRPaths;
 import org.unicode.cldr.util.CLDRTransforms;
 import org.unicode.cldr.util.Factory;
 import org.unicode.cldr.util.Pair;
 import org.unicode.cldr.util.PathUtilities;
 import org.unicode.cldr.util.XMLFileReader;
 import org.unicode.cldr.util.XPathParts;

 import com.google.common.base.Joiner;
 import com.google.common.collect.ImmutableSet;
 import com.ibm.icu.impl.Utility;
 import com.ibm.icu.lang.UCharacter;
 import com.ibm.icu.lang.UCharacterEnums.ECharacterCategory;
 import com.ibm.icu.text.Normalizer2;
 import com.ibm.icu.text.Transliterator;
 import com.ibm.icu.text.UnicodeSet;
 import com.ibm.icu.util.ULocale;

 public class TestTransforms extends TestFmwkPlus {
     CLDRConfig testInfo = CLDRConfig.getInstance();

     public static void main(String[] args) {
         new TestTransforms().run(args);
     }

     public void TestUzbek() {
         register();
         Transliterator cyrillicToLatin = Transliterator
             .getInstance("uz_Cyrl-uz_Latn");
         Transliterator latinToCyrillic = cyrillicToLatin.getInverse();
         // for (Transliterator t2 : t.getElements()) {
         // System.out.println(t2.getSourceSet().toPattern(false) + " => " +
         // t2.getTargetSet().toPattern(false));
         // }
         String cyrillic = "аА бБ вВ гГ ғҒ   дД ЕеЕ    ЁёЁ    жЖ зЗ иИ йЙ кК қҚ лЛ мМ нН оО пП рР сС тТ уУ ўЎ   фФ хХ ҳҲ ЦцЦ    ЧчЧ    ШшШ    бъ Ъ эЭ ЮюЮ    ЯяЯ";
         String latin = "aA bB vV gG gʻGʻ dD YeyeYE YoyoYO jJ zZ iI yY kK qQ lL mM nN oO pP rR sS tT uU oʻOʻ fF xX hH TstsTS ChchCH ShshSH bʼ ʼ eE YuyuYU YayaYA";
         UnicodeSet vowelsAndSigns = new UnicodeSet(
             "[аА еЕёЁ иИ оО уУўЎ эЭ юЮ яЯ ьЬ ъЪ]").freeze();
         UnicodeSet consonants = new UnicodeSet().addAll(cyrillic)
             .removeAll(vowelsAndSigns).remove(" ").freeze();

         // UnicodeSet englishVowels = new UnicodeSet();
         // for (String s : vowelsAndSigns) {
         // String result = cyrillicToLatin.transform(s);
         // if (!result.isEmpty()) {
         // englishVowels.add(result);
         // }
         // }
         // System.out.println(englishVowels.toPattern(false));

         String[] cyrillicSplit = cyrillic.split("\\s+");
         String[] latinSplit = latin.split("\\s+");
         for (int i = 0; i < cyrillicSplit.length; ++i) {
             assertTransformsTo("Uzbek to Latin", latinSplit[i],
                 cyrillicToLatin, cyrillicSplit[i]);
             assertTransformsTo("Uzbek to Cyrillic", cyrillicSplit[i],
                 latinToCyrillic, latinSplit[i]);
         }

         // # е → 'ye' at the beginning of a syllable, after a vowel, ъ or ь,
         // otherwise 'e'

         assertEquals("Uzbek to Latin", "Belgiya",
             cyrillicToLatin.transform("Бельгия"));
         UnicodeSet lower = new UnicodeSet("[:lowercase:]");
         for (String e : new UnicodeSet("[еЕ]")) {
             String ysuffix = lower.containsAll(e) ? "ye" : "YE";
             String suffix = lower.containsAll(e) ? "e" : "E";
             for (String s : vowelsAndSigns) {
                 String expected = getPrefix(cyrillicToLatin, s, ysuffix);
                 assertTransformsTo("Uzbek to Latin ye", expected,
                     cyrillicToLatin, s + e);
             }
             for (String s : consonants) {
                 String expected = getPrefix(cyrillicToLatin, s, suffix);
                 assertTransformsTo("Uzbek to Latin e", expected,
                     cyrillicToLatin, s + e);
             }
             for (String s : Arrays.asList(" ", "")) { // start of string,
                 // non-letter
                 String expected = getPrefix(cyrillicToLatin, s, ysuffix);
                 assertTransformsTo("Uzbek to Latin ye", expected,
                     cyrillicToLatin, s + e);
             }
         }

         if (isVerbose()) {
             // Now check for correspondences
             Factory factory = testInfo.getCldrFactory();
             CLDRFile uzLatn = factory.make("uz_Latn", false);
             CLDRFile uzCyrl = factory.make("uz", false);

             Set<String> latinFromCyrillicSucceeds = new TreeSet<>();
             Set<String> latinFromCyrillicFails = new TreeSet<>();
             for (String path : uzCyrl) {
                 String latnValue = uzLatn.getStringValue(path);
                 if (latnValue == null) {
                     continue;
                 }
                 String cyrlValue = uzCyrl.getStringValue(path);
                 if (cyrlValue == null) {
                     continue;
                 }
                 String latnFromCyrl = cyrillicToLatin.transform(latnValue);
                 if (latnValue.equals(latnFromCyrl)) {
                     latinFromCyrillicSucceeds.add(latnValue + "\t←\t"
                         + cyrlValue);
                 } else {
                     latinFromCyrillicFails.add(latnValue + "\t≠\t"
                         + latnFromCyrl + "\t←\t" + cyrlValue);
                 }
             }
             logln("Success! " + latinFromCyrillicSucceeds.size() + "\n"
                 + Joiner.on("\n").join(latinFromCyrillicSucceeds));
             logln("\nFAILS!" + latinFromCyrillicFails.size() + "\n"
                 + Joiner.on("\n").join(latinFromCyrillicFails));
         }
     }

     private String getPrefix(Transliterator cyrillicToLatin,
         String prefixSource, String suffix) {
         String result = cyrillicToLatin.transform(prefixSource);
         if (!result.isEmpty()
             && UCharacter.getType(suffix.codePointAt(0)) != ECharacterCategory.UPPERCASE_LETTER
             && UCharacter.getType(result.codePointAt(0)) == ECharacterCategory.UPPERCASE_LETTER) {
             result = UCharacter.toTitleCase(result, null);
         }
         return result + suffix;
     }

     public void TestBackslashHalfwidth() throws Exception {
         register();
         // CLDRTransforms.registerCldrTransforms(null,
         // "(?i)(Fullwidth-Halfwidth|Halfwidth-Fullwidth)", isVerbose() ?
         // getLogPrintWriter() : null);
         // Transliterator.DEBUG = true;

         String input = "＼"; // FF3C
         String expected = "\\"; // 005C
         Transliterator t = Transliterator.getInstance("Fullwidth-Halfwidth");
         String output = t.transliterate(input);
         assertEquals("To Halfwidth", expected, output);

         input = "\\"; // FF3C
         expected = "＼"; // 005C
         Transliterator t2 = t.getInverse();
         output = t2.transliterate(input);
         assertEquals("To FullWidth", expected, output);
     }

     public void TestASimple() {
         Transliterator foo = Transliterator.getInstance("cs-cs_FONIPA");
     }

     boolean registered = false;

     void register() {
         if (!registered) {
             CLDRTransforms.registerCldrTransforms(null, null,
                 isVerbose() ? getLogPrintWriter() : null, true);
             registered = true;
         }
     }

     enum Options {
         transliterator, roundtrip
     }

     private String makeLegacyTransformID(String source, String target, String variant) {
         if (variant != null) {
             return source + "-" + target + "/" + variant;
         } else {
             return source + "-" + target;
         }
     }

     private void checkTransformID(String id, File file) {
         if (id.indexOf("-t-") > 0) {
             String expected = ULocale.forLanguageTag(id).toLanguageTag();
             if (!id.equals(expected)) {
                 errln(file.getName() + ": BCP47-T identifier \"" +
                     id + "\" should be \"" + expected + "\"");
             }
         }
     }

     private void addTransformID(String id, File file, Map<String, File> ids) {
         File oldFile = ids.get(id);
         if (oldFile == null || oldFile.equals(file)) {
             ids.put(id, file);
         } else {
             errln(file.getName() + ": Transform \"" + id +
                 "\" already defined in " + oldFile.getName());
         }
     }

     private void addTransformIDs(File file, XPathParts parts, int element, Map<String, File> ids) {
         String source = parts.getAttributeValue(element, "source");
         String target = parts.getAttributeValue(element, "target");
         String variant = parts.getAttributeValue(element, "variant");
         String direction = parts.getAttributeValue(element, "direction");

         if (source != null && target != null) {
             if ("forward".equals(direction)) {
                 addTransformID(makeLegacyTransformID(source, target, variant), file, ids);
             } else if ("both".equals(direction)) {
                 addTransformID(makeLegacyTransformID(source, target, variant), file, ids);
                 addTransformID(makeLegacyTransformID(target, source, variant), file, ids);
             }
         }

         String alias = parts.getAttributeValue(element, "alias");
         if (alias != null) {
             for (String id : alias.split("\\s+")) {
                 addTransformID(id, file, ids);
             }
         }

         String backwardAlias = parts.getAttributeValue(element, "backwardAlias");
         if (backwardAlias != null) {
             if (!"both".equals(direction)) {
                 errln(file.getName() + ": Expected direction=\"both\" " +
                     "when backwardAlias is present");
             }

             for (String id : backwardAlias.split("\\s+")) {
                 addTransformID(id, file, ids);
             }
         }
     }

     private Map<String, File> getTransformIDs(String transformsDirectoryPath) {
         Map<String, File> ids = new HashMap<>();
         File dir = new File(transformsDirectoryPath);
         if (!dir.exists()) {
             errln("Cannot find transforms directory at " + transformsDirectoryPath);
             return ids;
         }

         for (File file : dir.listFiles()) {
             if (!file.getName().endsWith(".xml")) {
                 continue;
             }
             List<Pair<String, String>> data = new ArrayList<>();
             XMLFileReader.loadPathValues(file.getPath(), data, true);
             for (Pair<String, String> entry : data) {
                 final String xpath = entry.getFirst();
                 if (xpath.startsWith("//supplementalData/transforms/transform[")) {
                     String fileName = file.getName();
                     XPathParts parts = XPathParts.getFrozenInstance(xpath);
                     addTransformIDs(file, parts, 2, ids);
                 }
             }
         }
         return ids;
     }

     final ImmutableSet<String> OK_MISSING_FROM_OLD = ImmutableSet.of("und-Sarb-t-und-ethi",
         "Ethi-Sarb", "und-Ethi-t-und-latn", "Musnad-Ethiopic", "und-Ethi-t-und-sarb",
         "Sarb-Ethi", "Ethiopic-Musnad");

     public void TestTransformIDs() {
         Map<String, File> transforms = getTransformIDs(CLDRPaths.TRANSFORMS_DIRECTORY);
         for (Map.Entry<String, File> entry : transforms.entrySet()) {
             checkTransformID(entry.getKey(), entry.getValue());
         }

         // Only run the rest in exhaustive mode since it requires CLDR_ARCHIVE_DIRECTORY.
         if (getInclusion() <= 5) {
             return;
         }

         Set<String> removedTransforms = new HashSet<>();
         removedTransforms.add("ASCII-Latin"); // http://unicode.org/cldr/trac/ticket/9163

         Map<String, File> oldTransforms = getTransformIDs(CLDRPaths.LAST_TRANSFORMS_DIRECTORY);
         for (Map.Entry<String, File> entry : oldTransforms.entrySet()) {
             String id = entry.getKey();
             if (!transforms.containsKey(id)
                 && !removedTransforms.contains(id)
                 && !OK_MISSING_FROM_OLD.contains(id)) {
                 File oldFile = entry.getValue();
                 errln("Missing transform \"" + id +
                     "\"; the previous CLDR release had defined it in " + oldFile.getName());
             }
         }
     }

     public void Test1461() {
         register();

         String[][] tests = {
             { "transliterator=", "Katakana-Latin" },
             { "\u30CF \u30CF\uFF70 \u30CF\uFF9E \u30CF\uFF9F",
             "ha hā ba pa" },
             { "transliterator=", "Hangul-Latin" },
             { "roundtrip=", "true" }, { "갗", "gach" }, { "느", "neu" }, };

         Transliterator transform = null;
         Transliterator inverse = null;
         String id = null;
         boolean roundtrip = false;
         for (String[] items : tests) {
             String source = items[0];
             String target = items[1];
             if (source.endsWith("=")) {
                 switch (Options.valueOf(source
                     .substring(0, source.length() - 1).toLowerCase(
                         Locale.ENGLISH))) {
                         case transliterator:
                             id = target;
                             transform = Transliterator.getInstance(id);
                             inverse = Transliterator.getInstance(id,
                                 Transliterator.REVERSE);
                             break;
                         case roundtrip:
                             roundtrip = target.toLowerCase(Locale.ENGLISH).charAt(0) == 't';
                             break;
                 }
                 continue;
             }
             String result = transform.transliterate(source);
             assertEquals(id + ":from " + source, target, result);
             if (roundtrip) {
                 String result2 = inverse.transliterate(target);
                 assertEquals(id + " (inv): from " + target, source, result2);
             }
         }
     }

     public void Test8921() {
         register();
         Transliterator trans = Transliterator.getInstance("Latin-ASCII");
         assertEquals("Test8921", "Kornil'ev Kirill",
             trans.transliterate("Kornilʹev Kirill"));
     }

     private Pattern rfc6497Pattern = Pattern.compile("([a-zA-Z0-9-]+)-t-([a-zA-Z0-9-]+?)(?:-m0-([a-zA-Z0-9-]+))?");

     // cs-fonipa --> cs_fonipa; und-deva --> deva
     // TODO: Remove this workaround once ICU supports BCP47-T identifiers.
     // http://bugs.icu-project.org/trac/ticket/12599
     private String getLegacyCode(String code) {
         code = code.replace('-', '_');
         if (code.startsWith("und_") && code.length() == 8) {
             code = code.substring(4);
         }
         return code;
     }

     private Transliterator getTransliterator(String id) {
         return Transliterator.getInstance(getOldTranslitId(id));
     }

     private String getOldTranslitId(String id) {
         // TODO: Pass unmodified transform name to ICU, once
         // ICU can handle transform identifiers according to
         // BCP47 Extension T (RFC 6497). The rewriting below
         // is just a temporary workaround, allowing us to use
         // BCP47-T identifiers for naming test data files.
         // http://bugs.icu-project.org/trac/ticket/12599
         if (id.equalsIgnoreCase("und-t-d0-publish")) {
             return ("Any-Publishing");
         } else if (id.equalsIgnoreCase("und-t-s0-publish")) {
             return ("Publishing-Any");
         } else if (id.equalsIgnoreCase("de-t-de-d0-ascii")) {
             return ("de-ASCII");
         } else if (id.equalsIgnoreCase("my-t-my-s0-zawgyi")) {
             return ("Zawgyi-my");
         } else if (id.equalsIgnoreCase("my-t-my-d0-zawgyi")) {
             return "my-Zawgyi";
         } else if (id.equalsIgnoreCase("und-t-d0-ascii")) {
             return ("Latin-ASCII");
         }

         Matcher rfc6497Matcher = rfc6497Pattern.matcher(id);
         if (rfc6497Matcher.matches()) {
             String targetLanguage = getLegacyCode(rfc6497Matcher.group(1));
             String originalLanguage = getLegacyCode(rfc6497Matcher.group(2));
             String mechanism = rfc6497Matcher.group(3);
             id = originalLanguage + "-" + targetLanguage;
             if (mechanism != null && !mechanism.isEmpty()) {
                 id += "/" + mechanism.replace('-', '_');
             }
         }
         return id;
     }

     public void TestData() {
         register();
         try {
             // get the folder name
             String name = TestTransforms.class.getResource(".").toString();
             if (!name.startsWith("file:")) {
                 throw new IllegalArgumentException("Internal Error");
             }
             name = name.substring(5);
             File fileDirectory = new File(CLDRPaths.TEST_DATA + "transforms/");
             String fileDirectoryName = PathUtilities.getNormalizedPathString(fileDirectory);
             assertTrue(fileDirectoryName, fileDirectory.exists());

             logln("Testing files in: " + fileDirectoryName);

             Set<String> foundTranslitsLower = new TreeSet();

             for (String file : fileDirectory.list()) {
                 if (!file.endsWith(".txt") || file.startsWith("_readme")) {
                     continue;
                 }
                 logln("Testing file: " + file);
                 String transName = file.substring(0, file.length() - 4);
                 if (transName.equals("ka-Latn-t-ka-m0-bgn")) {
                     logKnownIssue("cldrbug:10566", "Jenkins build failing on translit problem");
                     continue; // failures like the following need to be fixed first.
                     // Error: (TestTransforms.java:434) : ka-Latn-t-ka-m0-bgn 2 Transform უფლება: expected "up’leba", got "upleba"
                 }

                 Transliterator trans = getTransliterator(transName);
                 String id = trans.getID().toLowerCase(Locale.ROOT);
                 foundTranslitsLower.add(id);

                 BufferedReader in = FileUtilities.openUTF8Reader(fileDirectoryName, file);
                 int counter = 0;
                 while (true) {
                     String line = in.readLine();
                     if (line == null)
                         break;
                     line = line.trim();
                     counter += 1;
                     if (line.startsWith("#")) {
                         continue;
                     }
                     String[] parts = line.split("\t");
                     String source = parts[0];
                     String expected = parts[1];
                     String result = trans.transform(source);
                     assertEquals(transName + " " + counter + " Transform "
                         + source, expected, result);
                 }
                 in.close();
             }
             Set<String> allTranslitsLower = oldEnumConvertLower(Transliterator.getAvailableIDs(), new TreeSet<>());
             // see which are missing tests
             for (String s : allTranslitsLower) {
                 if (!foundTranslitsLower.contains(s)) {
                     warnln("Translit with no test file:\t" + s);
                 }
             }

             // all must be superset of found tests
             for (String s : foundTranslitsLower) {
                 if (!allTranslitsLower.contains(s)) {
                     warnln("Test file with no translit:\t" + s);
                 }
             }

         } catch (IOException e) {
             throw new IllegalArgumentException(e);
         }
     }

     private <T, U extends Collection<T>> U oldEnumConvert(Enumeration<T> source, U target) {
         while (source.hasMoreElements()) {
             target.add(source.nextElement());
         }
         return target;
     }

     private <U extends Collection<String>> U oldEnumConvertLower(Enumeration<String> source, U target) {
         while (source.hasMoreElements()) {
             target.add(source.nextElement().toLowerCase(Locale.ROOT));
         }
         return target;
     }


     enum Casing {
         Upper, Title, Lower
     }

     public void TestCasing() {
         register();
         String greekSource = "ΟΔΌΣ Οδός Σο ΣΟ oΣ ΟΣ σ ἕξ";
         // Transliterator.DEBUG = true;
         Transliterator elTitle = checkString("el", Casing.Title,
             "Οδός Οδός Σο Σο Oς Ος Σ Ἕξ", greekSource, true);
         Transliterator elLower = checkString("el", Casing.Lower,
             "οδός οδός σο σο oς ος σ ἕξ", greekSource, true);
         Transliterator elUpper = checkString("el", Casing.Upper,
             "ΟΔΟΣ ΟΔΟΣ ΣΟ ΣΟ OΣ ΟΣ Σ ΕΞ", greekSource, true); // now true due to ICU #5456

         String turkishSource = "Isiİ İsıI";
         Transliterator trTitle = checkString("tr", Casing.Title, "Isii İsıı",
             turkishSource, true);
         Transliterator trLower = checkString("tr", Casing.Lower, "ısii isıı",
             turkishSource, true);
         Transliterator trUpper = checkString("tr", Casing.Upper, "ISİİ İSII",
             turkishSource, true);
         Transliterator azTitle = checkString("az", Casing.Title, "Isii İsıı",
             turkishSource, true);
         Transliterator azLower = checkString("az", Casing.Lower, "ısii isıı",
             turkishSource, true);
         Transliterator azUpper = checkString("az", Casing.Upper, "ISİİ İSII",
             turkishSource, true);

         String lithuanianSource = "I \u00CF J J\u0308 \u012E \u012E\u0308 \u00CC \u00CD \u0128 xi\u0307\u0308 xj\u0307\u0308 x\u012F\u0307\u0308 xi\u0307\u0300 xi\u0307\u0301 xi\u0307\u0303 XI X\u00CF XJ XJ\u0308 X\u012E X\u012E\u0308";
         // The following test was formerly skipped with
         // !logKnownIssue("11094", "Fix ICU4J UCharacter.toTitleCase/toLowerCase for lt").
         // However [https://unicode-org.atlassian.net/browse/ICU-11094] is supposedly
         // fixed in the version of ICU4J currently in CLDR, but removing the logKnownIssue
         // to execute the test results in test failures, mainly for  i\u0307\u0308.
         // So I am changing the logKnownIssue to reference a CLDR ticket about
         // investigating the test (it may be wrong).
         if (!logKnownIssue("cldrbug:13313",
             "Investigate the Lithuanian casing test, it may be wrong")) {
             Transliterator ltTitle = checkString(
                 "lt",
                 Casing.Title,
                 "I \u00CF J J\u0308 \u012E \u012E\u0308 \u00CC \u00CD \u0128 Xi\u0307\u0308 Xj\u0307\u0308 X\u012F\u0307\u0308 Xi\u0307\u0300 Xi\u0307\u0301 Xi\u0307\u0303 Xi Xi\u0307\u0308 Xj Xj\u0307\u0308 X\u012F X\u012F\u0307\u0308",
                 lithuanianSource, true);
             Transliterator ltLower = checkString(
                 "lt",
                 Casing.Lower,
                 "i i\u0307\u0308 j j\u0307\u0308 \u012F \u012F\u0307\u0308 i\u0307\u0300 i\u0307\u0301 i\u0307\u0303 xi\u0307\u0308 xj\u0307\u0308 x\u012F\u0307\u0308 xi\u0307\u0300 xi\u0307\u0301 xi\u0307\u0303 xi xi\u0307\u0308 xj xj\u0307\u0308 x\u012F x\u012F\u0307\u0308",
                 lithuanianSource, true);
         }
         Transliterator ltUpper = checkString(
             "lt",
             Casing.Upper,
             "I \u00CF J J\u0308 \u012E \u012E\u0308 \u00CC \u00CD \u0128 X\u00CF XJ\u0308 X\u012E\u0308 X\u00CC X\u00CD X\u0128 XI X\u00CF XJ XJ\u0308 X\u012E X\u012E\u0308",
             lithuanianSource, true);

         String dutchSource = "IJKIJ ijkij IjkIj";
         Transliterator nlTitle = checkString("nl", Casing.Title,
             "IJkij IJkij IJkij", dutchSource, true);
         // Transliterator nlLower = checkString("nl", Casing.Lower, "ısii isıı",
         // turkishSource);
         // Transliterator nlUpper = checkString("tr", Casing.Upper, "ISİİ İSII",
         // turkishSource);
     }

     private Transliterator checkString(String locale, Casing casing,
         String expected, String source, boolean sameAsSpecialCasing) {
         Transliterator translit = Transliterator.getInstance(locale + "-"
             + casing);
         String result = checkString(locale, expected, source, translit);
         ULocale ulocale = new ULocale(locale);
         String specialCasing;
         Normalizer2 normNFC = Normalizer2.getNFCInstance(); // UCharacter.toXxxCase
         // doesn't
         // normalize,
         // Transliterator
         // does
         switch (casing) {
         case Upper:
             specialCasing = normNFC.normalize(UCharacter.toUpperCase(ulocale,
                 source));
             break;
         case Title:
             specialCasing = normNFC.normalize(UCharacter.toTitleCase(ulocale,
                 source, null));
             break;
         case Lower:
             specialCasing = normNFC.normalize(UCharacter.toLowerCase(ulocale,
                 source));
             break;
         default:
             throw new IllegalArgumentException();
         }
         if (sameAsSpecialCasing) {
             if (!assertEquals(locale + "-" + casing + " Vs SpecialCasing",
                 specialCasing, result)) {
                 showFirstDifference("Special: ", specialCasing, "Transform: ",
                     result);
             }
         } else {
             assertNotEquals(locale + "-" + casing + "Vs SpecialCasing",
                 specialCasing, result);
         }
         return translit;
     }

     private String checkString(String locale, String expected, String source,
         Transliterator translit) {
         String transformed = translit.transform(source);
         if (!assertEquals(locale, expected, transformed)) {
             showTransliterator(translit);
         }
         return transformed;
     }

     private void showFirstDifference(String titleA, String a, String titleB,
         String b) {
         StringBuilder buffer = new StringBuilder();
         for (int i = 0; i < Math.min(a.length(), b.length()); ++i) {
             char aChar = a.charAt(i);
             char bChar = b.charAt(i);
             if (aChar == bChar) {
                 buffer.append(aChar);
             } else {
                 errln("\t" + buffer + "\n\t\t" + titleA + "\t"
                     + Utility.hex(a.substring(i)) + "\n\t\t" + titleB
                     + "\t" + Utility.hex(b.substring(i)));
                 return;
             }
         }
         errln("different length");
     }

     private void showTransliterator(Transliterator t) {
         org.unicode.cldr.test.TestTransforms.showTransliterator("", t, 999);
     }

     public void Test9925() {
         register();
         Transliterator pinyin = getTransliterator("und-Latn-t-und-hani");
         assertEquals("賈 bug", "jiǎ", pinyin.transform("賈"));
     }

     public void TestHiraKata() { // for CLDR-13127 and ...
         register();
         Transliterator hiraKata = getTransliterator("Hiragana-Katakana");
         assertEquals("Hira-Kata", hiraKata.transform("゛゜ わ゙ ゟ"), "゛゜ ヷ ヨリ");
     }

   public void TestZawgyiToUnicode10899() {
     // Some tests for the transformation of Zawgyi font encoding to Unicode Burmese.
     Transliterator z2u = getTransliterator("my-t-my-s0-zawgyi");

     String z1 =
         "\u1021\u102C\u100F\u102C\u1015\u102D\u102F\u1004\u1039\u1031\u1010\u103C";
     String expected =
         "\u1021\u102C\u100F\u102C\u1015\u102D\u102F\u1004\u103A\u1010\u103D\u1031";

     String actual = z2u.transform(z1);

     assertEquals("z1 to u1", expected, actual);

     String z2 = "တကယ္ဆို အျငိႈးေတြမဲ႔ေသာလမ္းေသာလမ္းမွာ တိုႈျပန္ဆံုျကတဲ႔အခါ ";
     expected = "တကယ်ဆို အငြှိုးတွေမဲ့သောလမ်းသောလမ်းမှာ တှိုပြန်ဆုံကြတဲ့အခါ ";
     actual = z2u.transform(z2);
     assertEquals("z2 to u2", expected, actual);

     String z3 = "ျပန္လမ္းမဲ့ကၽြန္းအပိုင္း၄";
     expected = "ပြန်လမ်းမဲ့ကျွန်းအပိုင်း၎";
     actual = z2u.transform(z3);
     assertEquals("z3 to u3", expected, actual);
   }

   public void TestUnicodeToZawgyi111107() {
     // Some tests for the transformation from Unicode to Zawgyi font encoding
     Transliterator u2z = getTransliterator("my-t-my-d0-zawgyi");

     String expected =
         "\u1021\u102C\u100F\u102C\u1015\u102D\u102F\u1004\u1039\u1031\u1010\u103C";
     String u1 =
         "\u1021\u102C\u100F\u102C\u1015\u102D\u102F\u1004\u103A\u1010\u103D\u1031";

     String actual = u2z.transform(u1);

     assertEquals("u1 to z1", expected, actual);

     expected = "တကယ္ဆို အၿငႇိဳးေတြမဲ့ေသာလမ္းေသာလမ္းမွာ တိႈျပန္ဆံုၾကတဲ့အခါ ";
     String u2 = "တကယ်ဆို အငြှိုးတွေမဲ့သောလမ်းသောလမ်းမှာ တှိုပြန်ဆုံကြတဲ့အခါ ";
     actual = u2z.transform(u2);
     assertEquals("u2 to z2", expected, actual);

     expected = "ျပန္လမ္းမဲ့ကြၽန္းအပိုင္း၄";
     String u3 = "ပြန်လမ်းမဲ့ကျွန်းအပိုင်း၎";
     actual = u2z.transform(u3);
     assertEquals("u3 to z3", expected, actual);
   }
 }