blob: de1096cf5da86ed6cca32682b092c42750543064 [file] [log] [blame]
--- icu4c/source/data/brkitr/ja.txt
+++ icu4c/source/data/brkitr/ja.txt
@@ -12,4 +12,64 @@ ja{
line_strict:process(dependency){"line_cj.brk"}
line_strict_phrase:process(dependency){"line_phrase_cj.brk"}
}
+ extensions{
+ // Extensions.
+ // Entries in cjdict.txt categorized as particles (助詞), auxiliary verbs (助動詞),
+ // conjugations (活用) and prefix of them.
+ // These entries are connected to the previous words for phrase based line breaking.
+ // https://ja.wikipedia.org/wiki/助詞
+ // https://ja.wikipedia.org/wiki/助動詞_(国文法)
+ // https://ja.wikipedia.org/wiki/活用
+ かい, かしら, から, きり, くらい,
+ ぐらい, けれど, けれども, こそ, さえ,
+ しか, した, ずつ, せる, せん,
+ たい, たがる, たく, たら, たり,
+ だけ, だに, だの, だり, つつ,
+ てる, です, でも, ところが, ところで,
+ とも, ない, なか, ながら, なく,
+ なし, なぞ, など, なら, なり,
+ なんぞ, ねる, ので, のに, のみ,
+ ばかり, へる, ほど, まい, まう,
+ まし, ます, まっ, まで, まま,
+ もん, やら, よう, より, らしい,
+ られる, れる, ろう, わっ, わな,
+ わら, わり, わる, われ, わん,
+
+ // Entries added for technical reasons (particle + others).
+ // Entries in cjdict.txt, which are compound words starting from the above categories
+ // (i.e. particles, auxiliary verbs and conjunctions).
+ // These entries are connected to the previous words for phrase based line breaking.
+ えたい, えて, える, けた, けたい,
+ ける, させる, そうだ, っきゃ, っきり,
+ っけ, っす, ったらしい, っちゅう, って,
+ っていう, ってか, ってな, っと, っぱなし,
+ っぷり, っぽい, にあう, にあがる, にあたって,
+ にあたり, にあたりまして, にあたります, にあたる, において,
+ におきまして, における, にかけ, にかけて, にかけまして,
+ にたいして, にたいしまして, にたいします, にたいする, について,
+ につき, につきまして, につけ, につれ, につれて,
+ にて, にとって, にとり, にとりまして, にまつわります,
+ にまつわる, にもかかわらず, にゃ, によって, により,
+ によりまして, によります, による, にわたって, にわたり,
+ にわたりまして, にわたります, にわたる, に対し, に対して,
+ に対しまして, に対します, に対する, に当たって, に当たり,
+ に当たりまして, に当たります, に当たる, に従い, に従いまして,
+ に従います, に従う, に従って, に関し, に関して,
+ に関しまして, に関します, に関する, に際し, に際して,
+ ものの, ろうし, ろうと, われと, をの,
+ をめぐって, をめぐりまして, をめぐります, をめぐる, をもちまして,
+ をもって, を以て, を通して, を通しまして, を通じ,
+ を通じて, を通じまして, んじゃ, んで,
+
+ // Entries added for technical reasons (noun suffix).
+ // Entries in cjdict.txt, which are suffixes of nouns.
+ // These entries should be connected to the previous (noun) words.
+ 々宮, 々家, え目, が丘, が台,
+ が床, が浜, ヵ国, ヵ年, ヵ所,
+ ヵ月, ヵ村, ヵ条, ヶ丘, ヶ国,
+ ヶ島, ヶ年, ヶ所, ヶ月, ヶ村,
+ ヶ条, ージ, ーズ, ータ, ード,
+ ーニャ, ープランス, ーユ, ーランド, ーリンズ,
+ ーン,
+ }
}