blob: f447e2b56a2369e965893323ca64a84d5936e5d1 [file] [log] [blame]
// Japanese
//
// Copyright (C) 2017 Reece H. Dunn
//
// This program is free software; you can redistribute it and/or modify
// it under the terms of the GNU General Public License as published by
// the Free Software Foundation; either version 3 of the License, or
// (at your option) any later version.
//
// This program is distributed in the hope that it will be useful,
// but WITHOUT ANY WARRANTY; without even the implied warranty of
// MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
// GNU General Public License for more details.
//
// You should have received a copy of the GNU General Public License
// along with this program; if not, see: <http://www.gnu.org/licenses/>.
// Replacements:
// 1. Map Katakana to Hiragana.
// 2. Map voiced characters to their base form and voicing combined character.
.replace
// U+3040 - U+309F Hiragana ----------------------------
が // ga: U+304C => U+304B U+3099
ぎ // gi: U+304E => U+304D U+3099
ぐ // gu: U+3050 => U+304F U+3099
げ // ge: U+3052 => U+3051 U+3099
ご // go: U+3054 => U+3053 U+3099
ざ // za: U+3056 => U+3055 U+3099
じ // ji: U+3058 => U+3057 U+3099
ず // zu: U+305A => U+3059 U+3099
ぜ // ze: U+305C => U+305B U+3099
ぞ // zo: U+305E => U+305D U+3099
だ // da: U+3060 => U+305F U+3099
ぢ // ji: U+3062 => U+3061 U+3099 (obsolete)
づ // zu: U+3065 => U+3064 U+3099
で // de: U+3067 => U+3066 U+3099
ど // do: U+3069 => U+3068 U+3099
ば // ba: U+3070 => U+306F U+3099
ぱ // pa: U+3071 => U+306F U+309A
び // bi: U+3073 => U+3072 U+3099
ぴ // pi: U+3074 => U+3072 U+309A
ぶ // bu: U+3076 => U+3075 U+3099
ぷ // pu: U+3077 => U+3075 U+309A
べ // be: U+3079 => U+3078 U+3099
ぺ // pe: U+307A => U+3078 U+309A
ぼ // bo: U+307C => U+307B U+3099
ぽ // po: U+307D => U+307B U+309A
ゔ // vu: U+3094 => U+3046 U+3099 (obsolete)
// U+309B => U+3099
// U+309C => U+309A
より // U+309F => U+3088 U+308A (yori digraph)
// U+30A0 - U+30FF Katakana ----------------------------
// a: U+30A1 => U+3041 (small)
// a: U+30A2 => U+3042
// i: U+30A3 => U+3043 (small)
// i: U+30A4 => U+3044
// u: U+30A5 => U+3045 (small)
// u: U+30A6 => U+3046
// e: U+30A7 => U+3047 (small)
// e: U+30A8 => U+3048
// o: U+30A9 => U+3049 (small)
// o: U+30AA => U+304A
// ka: U+30AB => U+304B
が // ga: U+30AC => U+304B U+3099
// ki: U+30AD => U+304D
ぎ // gi: U+30AE => U+304D U+3099
// ku: U+30AF => U+304F
ぐ // gu: U+30B0 => U+304F U+3099
// ke: U+30B1 => U+3051
げ // ge: U+30B2 => U+3051 U+3099
// ko: U+30B3 => U+3053
ご // go: U+30B4 => U+3053 U+3099
// sa: U+30B5 => U+3055
ざ // za: U+30B6 => U+3055 U+3099
// shi: U+30B7 => U+3057
じ // ji: U+30B8 => U+3057 U+3099
// su: U+30B9 => U+3059
ず // zu: U+30BA => U+3059 U+3099
// se: U+30BB => U+305B
ぜ // ze: U+30BC => U+305B U+3099
// so: U+30BD => U+305D
ぞ // zo: U+30BE => U+305D U+3099
// ta: U+30BF => U+305F
だ // da: U+30C0 => U+305F U+3099
// chi: U+30C1 => U+3061
ぢ // ji: U+30C2 => U+3061 U+3099 (obsolete)
// tsu: U+30C3 => U+3063 (small)
// tsu: U+30C4 => U+3064
づ // zu: U+30C5 => U+3064 U+3099
// te: U+30C6 => U+3066
で // de: U+30C7 => U+3066 U+3099
// to: U+30C8 => U+3068
ど // do: U+30C9 => U+3068 U+3099
// na: U+30CA => U+306A
// ni: U+30CB => U+306B
// nu: U+30CC => U+306C
// ne: U+30CD => U+306D
// no: U+30CE => U+306E
// ha: U+30CF => U+306F
ば // ba: U+30D0 => U+306F U+3099
ぱ // pa: U+30D1 => U+306F U+309A
// hi: U+30D2 => U+3072
び // bi: U+30D3 => U+3072 U+3099
ぴ // pi: U+30D4 => U+3072 U+309A
// fu: U+30D5 => U+3075
ぶ // bu: U+30D6 => U+3075 U+3099
ぷ // pu: U+30D7 => U+3075 U+309A
// he: U+30D8 => U+3078
べ // be: U+30D9 => U+3078 U+3099
ぺ // pe: U+30DA => U+3078 U+309A
// ho: U+30DB => U+307B
ぼ // bo: U+30DC => U+307B U+3099
ぽ // po: U+30DD => U+307B U+309A
// ma: U+30DE => U+307E
// mi: U+30DF => U+307F
// mu: U+30E0 => U+3080
// me: U+30E1 => U+3081
// mo: U+30E2 => U+3082
// ya: U+30E3 => U+3083 (small)
// ya: U+30E4 => U+3084
// yu: U+30E5 => U+3085 (small)
// yu: U+30E6 => U+3086
// yo: U+30E7 => U+3087 (small)
// yo: U+30E8 => U+3088
// ra: U+30E9 => U+3089
// ri: U+30EA => U+308A
// ru: U+30EB => U+308B
// re: U+30EC => U+308C
// ro: U+30ED => U+308D
// wa: U+30EE => U+308E (small)
// wa: U+30EF => U+308F
// wi: U+30F0 => U+3090
// we: U+30F1 => U+3091
// wo: U+30F2 => U+3092
// n: U+30F3 => U+3093
ゔ // vu: U+30F4 => U+3046 U+3099 (obsolete)
// ka: U+30F5 => U+3095 (small)
// ke: U+30F6 => U+3096 (small)
あ゙ // va: U+30F7 => U+3042 U+3099
い゙ // vi: U+30F8 => U+3044 U+3099
え゙ // ve: U+30F9 => U+3048 U+3099
お゙ // vo: U+30FA => U+304A U+3099
// U+30FD => U+309D (iteration mark)
// U+30FE => U+309E (voiced iteration mark)
こと // U+30FF => U+3053 U+3068 (koto digraph)
// U+FF65 - U+FF9F Halfwidth Katakana
// wo: U+FF66 => U+3092
// a: U+FF67 => U+3041 (small)
// i: U+FF68 => U+3043 (small)
// u: U+FF69 => U+3045 (small)
// e: U+FF6A => U+3047 (small)
// o: U+FF6B => U+3049 (small)
// ya: U+FF6C => U+3083 (small)
// yu: U+FF6D => U+3085 (small)
// yo: U+FF6E => U+3087 (small)
// tsu: U+FF6F => U+3063 (small)
// U+FF70 => U+30FC
// a: U+FF71 => U+3042
// i: U+FF72 => U+3044
// u: U+FF73 => U+3046
// e: U+FF74 => U+3048
// o: U+FF75 => U+304A
// ka: U+FF76 => U+304B
// ki: U+FF77 => U+304D
// ku: U+FF78 => U+304F
// ke: U+FF79 => U+3051
// ko: U+FF7A => U+3053
// sa: U+FF7B => U+3055
// shi: U+FF7C => U+3057
// su: U+FF7D => U+3059
// se: U+FF7E => U+305B
ソ // so: U+FF7F => U+305D
// ta: U+FF80 => U+305F
// chi: U+FF81 => U+3061
// tsu: U+FF82 => U+3064
// te: U+FF83 => U+3066
// to: U+FF84 => U+3068
// na: U+FF85 => U+306A
// ni: U+FF86 => U+306B
// nu: U+FF87 => U+306C
// ne: U+FF88 => U+306D
// no: U+FF89 => U+306E
// ha: U+FF8A => U+306F
// hi: U+FF8B => U+3072
// fu: U+FF8C => U+3075
// he: U+FF8D => U+3078
// ho: U+FF8E => U+307B
// ma: U+FF8F => U+307E
// mi: U+FF90 => U+307F
// mu: U+FF91 => U+3080
// me: U+FF92 => U+3081
// mo: U+FF93 => U+3082
// ya: U+FF94 => U+3084
// yu: U+FF95 => U+3086
// yo: U+FF96 => U+3088
// ra: U+FF97 => U+3089
// ri: U+FF98 => U+308A
// ru: U+FF99 => U+308B
// re: U+FF9A => U+308C
// ro: U+FF9B => U+308D
// wa: U+FF9C => U+308F
// n: U+FF9D => U+3093
// U+FF9E => U+3099
// U+FF9F => U+309A
// U+1B000 - U+1B001 Kana Supplement ---------------------
𛀀 // e: U+1B000 => U+3048 (archaic)
// Hiragana Groups -- By Starting Consonant
// a i u e o *
.L01 // k
.L02 が ぎ ぐ げ ご // g
.L03 // s
.L04 // sh
.L05 ざ ず ぜ ぞ づ // z
.L06 じ ぢ // j
.L07 // t
.L08 // ch
.L09 // ts
.L10 だ で ど // d
.L11 // n
.L12 // h
.L13 // f
.L14 ば び ぶ べ ぼ // b
.L15 ぱ ぴ ぷ ぺ ぽ // p
.L16 // m
.L17 // y
.L18 // r
.L19 // w
.L20 // none (vowels)
.L21 // y (small)
// Hiragana Combining Characters
.group
a // ya
ゃぁ a: // yā
ゃー a: // yā
.group
u // yu
ゅぅ u: // yū
ゅー u: // yū
.group
o // yo
ょぉ o: // yō
ょー o: // yō
// Hiragana
.group
a // a
ああ a: // ā
あぁ a: // ā
あー a: // ā
あ゙ va // va (Katakana)
あ゙あ va: // vā (Katakana)
あ゙ぁ va: // vā (Katakana)
あ゙ー va: // vā (Katakana)
.group
i // i
いい i: // ī
いぃ i: // ī
いー i: // ī
い゙ vi // vi (Katakana)
い゙い vi: // vī (Katakana)
い゙ぃ vi: // vī (Katakana)
い゙ー vi: // vī (Katakana)
.group
u // u
うう u: // ū
うぅ u: // ū
うー u: // ū
ゔ vu // vu
ゔう vu: // vū
ゔぅ vu: // vū
ゔー vu: // vū
.group
e // e
ええ e: // ē
えぇ e: // ē
えー e: // ē
え゙ ve // ve (Katakana)
え゙え ve: // vē (Katakana)
え゙ぇ ve: // vē (Katakana)
え゙ー ve: // vē (Katakana)
.group
o // o
おお o: // ō
おぉ o: // ō
おー o: // ō
お゙ vo // vo (Katakana)
お゙お vo: // vō (Katakana)
お゙ぉ vo: // vō (Katakana)
お゙ー vo: // vō (Katakana)
.group
ka // ka
かあ ka: // kā
かぁ ka: // kā
かー ka: // kā
が ga // ga
があ ga: // gā
がぁ ga: // gā
がー ga: // gā
.group
ki // ki
きい ki: // kī
きぃ ki: // kī
きー ki: // kī
(L21 k_j // ky([auo]
ぎ gi // gi
ぎい gi: // gī
ぎぃ gi: // gī
ぎー gi: // gī
ぎ (L21 g_j // gy([auo]
.group
ku // ku
くう ku: // kū
くぅ ku: // kū
くー ku: // kū
ぐ gu // gu
ぐう gu: // gū
ぐぅ gu: // gū
ぐー gu: // gū
.group
ke // ke
けえ ke: // kē
けぇ ke: // kē
けー ke: // kē
げ ge // ge
げえ ge: // gē
げぇ ge: // gē
げー ge: // gē
.group
ko // ko
こお ko: // kō
こぉ ko: // kō
こー ko: // kō
ご go // go
ごお go: // gō
ごぉ go: // gō
ごー go: // gō
.group
sa // sa
さあ sa: // sā
さぁ sa: // sā
さー sa: // sā
ざ za // za
ざあ za: // zā
ざぁ za: // zā
ざー za: // zā
.group
s\\i // shi
しい s\\i: // shī
しぃ s\\i: // shī
しー s\\i: // shī
(L21 s\\ // sh([auo]
じ d_z\\i // ji
じい d_z\\i: // jī
じぃ d_z\\i: // jī
じー d_z\\i: // jī
じ (L21 d_z\\ // j([auo]
.group
su // su
すう su: // sū
すぅ su: // sū
すー su: // sū
ず zu // zu
ずう zu: // zū
ずぅ zu: // zū
ずー zu: // zū
.group
se // se
せえ se: // sē
せぇ se: // sē
せー se: // sē
ぜ ze // ze
ぜえ ze: // zē
ぜぇ ze: // zē
ぜー ze: // zē
.group
so // so
そお so: // sō
そぉ so: // sō
そー so: // sō
ぞ zo // zo
ぞお zo: // zō
ぞぉ zo: // zō
ぞー zo: // zō
.group
ta // ta
たあ ta: // tā
たぁ ta: // tā
たー ta: // tā
だ da // da
だあ da: // dā
だぁ da: // dā
だー da: // dā
.group
t_s\\i // chi
ちい t_s\\i: // chī
ちぃ t_s\\i: // chī
ちー t_s\\i: // chī
(L21 t_s\\ // ch([auo]
ぢ d_z\\i // ji (obsolete)
ぢい d_z\\i: // jī (obsolete)
ぢぃ d_z\\i: // jī (obsolete)
ぢー d_z\\i: // jī (obsolete)
ぢ (L21 d_z\\ // j([auo] (obsolete)
.group
t_su // tsu
つう t_su: // tsū
つぅ t_su: // tsū
つー t_su: // tsū
づ zu // zu
づう zu: // zū
づぅ zu: // zū
づー zu: // zū
.group
te // te
てえ te: // tē
てぇ te: // tē
てー te: // tē
で de // de
でえ de: // dē
でぇ de: // dē
でー de: // dē
.group
to // to
とお to: // tō
とぉ to: // tō
とー to: // tō
ど do // do
どお do: // dō
どぉ do: // dō
どー do: // dō
.group
na // na
なあ na: // nā
なぁ na: // nā
なー na: // nā
.group
ni // ni
にい ni: // nī
にぃ ni: // nī
にー ni: // nī
(L21 n_j // ny([auo]
.group
nu // nu
ぬう nu: // nū
ぬぅ nu: // nū
ぬー nu: // nū
.group
ne // ne
ねえ ne: // nē
ねぇ ne: // nē
ねー ne: // nē
.group
no // no
のお no: // nō
のぉ no: // nō
のー no: // nō
.group
ha // ha
はあ ha: // hā
はぁ ha: // hā
はー ha: // hā
ば ba // ba
ばあ ba: // bā
ばぁ ba: // bā
ばー ba: // bā
ぱ pa // pa
ぱあ pa: // pā
ぱぁ pa: // pā
ぱー pa: // pā
.group
Ci // hi
ひい Ci: // hī
ひぃ Ci: // hī
ひー Ci: // hī
(L21 C // hy([auo]
び bi // bi
びい bi: // bī
びぃ bi: // bī
びー bi: // bī
び (L21 b_j // by([auo]
ぴ pi // pi
ぴい pi: // pī
ぴぃ pi: // pī
ぴー pi: // pī
ぴ (L21 p_j // py([auo]
.group
p\\u // fu
ふう p\\u: // fū
ふぅ p\\u: // fū
ふー p\\u: // fū
ぶ bu // bu
ぶう bu: // bū
ぶぅ bu: // bū
ぶー bu: // bū
ぷ pu // pu
ぷう pu: // pū
ぷぅ pu: // pū
ぷー pu: // pū
.group
he // he
へえ he: // hē
へぇ he: // hē
へー he: // hē
べ be // be
べえ be: // bē
べぇ be: // bē
べー be: // bē
ぺ pe // pe
ぺえ pe: // pē
ぺぇ pe: // pē
ぺー pe: // pē
.group
ho // ho
ほお ho: // hō
ほぉ ho: // hō
ほー ho: // hō
ぼ bo // bo
ぼお bo: // bō
ぼぉ bo: // bō
ぼー bo: // bō
ぽ po // po
ぽお po: // pō
ぽぉ po: // pō
ぽー po: // pō
.group
ma // ma
まあ ma: // mā
まぁ ma: // mā
まー ma: // mā
.group
mi // mi
みい mi: // mī
みぃ mi: // mī
みー mi: // mī
(L21 m_j // my([auo]
.group
mu // mu
むう mu: // mū
むぅ mu: // mū
むー mu: // mū
.group
me // me
めえ me: // mē
めぇ me: // mē
めー me: // mē
.group
mo // mo
もお mo: // mō
もぉ mo: // mō
もー mo: // mō
.group
ja // ya
やあ ja: // yā
やぁ ja: // yā
やー ja: // yā
.group
ju // yu
ゆう ju: // yū
ゆぅ ju: // yū
ゆー ju: // yū
.group 𛀁
𛀁 je // ye (archaic)
𛀁え je: // yē (archaic)
𛀁ぇ je: // yē (archaic)
𛀁ー je: // yē (archaic)
.group
jo // yo
よお jo: // yō
よぉ jo: // yō
よー jo: // yō
.group
r`a // ra
らあ r`a: // rā
らぁ r`a: // rā
らー r`a: // rā
.group
r`i // ri
りい r`i: // rī
りぃ r`i: // rī
りー r`i: // rī
(L21 r`_ja // ry([auo]
.group る
る r`u // ru
るう r`u: // rū
るぅ r`u: // rū
るー r`u: // rū
.group れ
れ r`e // re
れえ r`e: // rē
れぇ r`e: // rē
れー r`e: // rē
.group ろ
ろ r`o // ro
ろお r`o: // rō
ろぉ r`o: // rō
ろー r`o: // rō
.group わ
わ wa // wa
わあ wa: // wā
わぁ wa: // wā
わー wa: // wā
.group ゐ
ゐ i // wi (obsolete)
ゐい i: // wī (obsolete)
ゐぃ i: // wī (obsolete)
ゐー i: // wī (obsolete)
.group ゑ
ゑ we // we (obsolete)
ゑえ we: // wē (obsolete)
ゑぇ we: // wē (obsolete)
ゑー we: // wē (obsolete)
.group を
を o // wo
をお o: // wō
をぉ o: // wō
をー o: // wō
.group ん
ん N\\ // n
ん (L01 N // n (k
ん (L02 N // n (g
ん (L03 u~ // n (s
い) ん (L03 i~ // i) n (s
ん (L04 u~ // n (sh
い) ん (L04 i~ // i) n (sh
ん (L05 n // n (z
ん (L06 n // n (j
ん (L07 n // n (t
ん (L08 n // n (ch
ん (L09 n // n (ts
ん (L10 n // n (d
ん (L11 n // n (n
ん (L12 u~ // n (h
い) ん (L12 i~ // i) n (h
ん (L13 u~ // n (f
い) ん (L13 i~ // i) n (f
ん (L14 m // n (b
ん (L15 m // n (p
ん (L16 m // n (m
ん (L17 u~ // n (y
い) ん (L17 i~ // i) n (y
ん (L18 n // n (r
ん (L19 u~ // n (w
い) ん (L19 i~ // i) n (w
ん (L20 u~ // n ([vowel]
い) ん (L20 i~ // i) n ([vowel]
.group っ
っ (_ ?
っ (L01 k // k.k
っ (L02 g // g.g
っ (L03 s // s.s
っ (L04 s\\ // s.sh
っ (L05 z // z.z
っ (L06 d // d.j
っ (L07 t // t.t
っ (L08 t // t.ch
っ (L09 t // t.ts
っ (L10 d // d.d
っ (L14 b // b.b
っ (L15 p // p.p
っ (L16 m // m.m
っ (L18 r // r.r