Merge pull request #42 from tuna2134/easy

Fix bug
This commit is contained in:
コマリン親衛隊
2024-09-13 20:04:00 +09:00
committed by GitHub
2 changed files with 4 additions and 36 deletions

View File

@@ -4,36 +4,4 @@
・同一の漢字でも音読みと訓読みがある
・地名の読みが難しい
・主語、述語が省略される
などが挙げられます。
そして、やっと基本的な日本語を習得してもさらなる壁が立ちはだかっているのです。
例えば、「はやくいって」、この言葉がすべて平仮名で書かれていたり会話の中で出てきた場合です。
外国人のA君が大学の講義を終えてアルバイト先に向かっているとき、校門で日本人の友達B君に出会い進路相談をされ、1時間が経過してしまいます。さすがにもうアルバイトの開始時間に間に合わない!!そこでA君はB君に急いでいることを伝えると…B君から「はやくいって!」と言われました。
A君はその言葉の意味を理解しかねてしばし立ち尽くしてしまいます。
「はやくいって」は、「早く言って」と「早く行って」の両方の解釈が出来てしまうのです。
アルバイトがあって急いでいるのなら、その旨をB君に「早く言って」ほしかった。
2,アルバイトがあって急いでいるのなら、アルバイト先に「早く行って」
上記のように、複数の解釈ができる日本語が多く存在しており、「習得に時間がかかる言語である」といわれる理由の一つです。
{'input_ids': tensor([[ 2, 106, 1645, ..., 106, 2516, 108]], device='cuda:0'), 'attention_mask': tensor([1.], device='cuda:0')}
日本語には、「助数詞」と言って「数量を表現するのに用いる接尾語」があります。
この助数詞は、「種類の多さ」と「音の変化=変音現象」が特徴です。
紙→枚(まい)、車→台(だい)、列車→輌(りょう)、箸→膳(ぜん)、エンジン→基(き)
種類の多さもさることながら、もう一つの難しさが変音現象です。
例えば、カエルを数えるときに「1匹いっぴき」と読むのに対して「2匹≠にぴき」で2匹を「にぴき」とは読まずに「2匹にひき」となります。
どうしてこうなるのか。
ここには、漢語の半濁音のルール、というものが発生します。
まず、半濁音はハ行にだけしか付きません。(はひふへほ→ぱぴぷぺぽ)
そして、連濁といって語と語が合体するときに後ろに来る語の頭の部分が清音から濁音に変化します。
ハ行音の連濁のうち、前の語の最後に「つ」がくると、後ろの語の頭が半濁音に変わります。
例)切(せつ) + 腹(ふく) = 切腹(せっぷく)
 
助数詞も、数字の「一・六・八・十・百」が「ハ行音の助数詞」と結びつく時、促音便「っ(小さい”っ”)」を起こし、後ろの助数詞が半濁音となります。
1杯いち  はい  いっぱい、6泊ろく  はく  ろっぱく、8袋はち  ふくろ  はっぷくろ
10編じゅう  へん  じっぺん、100本ひゃく  ほん →ひゃっぽん
こういった理由から、「2匹→2ぴき」とはなりません。
などが挙げられます。

View File

@@ -230,13 +230,13 @@ impl TTSModelHolder {
options.sdp_ratio,
options.length_scale,
)?;
audios.push(audio);
audios.push(audio.clone());
if i != texts.len() - 1 {
audios.push(Array3::zeros((1, 22050, 1)));
audios.push(Array3::zeros((1, 1, 22050)));
}
}
concatenate(
Axis(0),
Axis(2),
&audios.iter().map(|x| x.view()).collect::<Vec<_>>(),
)?
} else {