久久精品国产99国产,四虎一区二区三区,色视频一区二区三区

多語(yǔ)種智能信息處理數(shù)據(jù)集專(zhuān)刊 II 區(qū)論文（已發(fā)表） ? 版本 ZH3 Vol 7 (2) 2022

蒙漢語(yǔ)音翻譯數(shù)據(jù)集

A dataset of Mongolian-Chinese speech translation

戚肖克，特尼格爾，孫媛，趙小兵

QI Xiaoke, BORJIGIN B. Teniger, SUN Yuan, ZHAO Xiaobing

?>>

DOI:? 10.11922/11-6035.csd.2021.0093.zh
PID:? 21.86101.1/11-6035.csd.2021.0093.zh
:? 10.11922/sciencedb.j00001.00345
?

： 2021 - 12 - 21

： 2022 - 05 - 17

： 2022 - 01 - 28

： 2022 - 06 - 28

4963 12 0

摘要&關(guān)鍵詞

摘要：目前，由于缺乏公開(kāi)數(shù)據(jù)集，面向少數(shù)民族語(yǔ)言的語(yǔ)音翻譯的研究較少。為此，本文構(gòu)建并公開(kāi)了蒙語(yǔ)語(yǔ)音到漢語(yǔ)文本語(yǔ)音翻譯數(shù)據(jù)集 (NMLR-Mon2Chs ST)。本數(shù)據(jù)集包含36位年齡在20–25歲之間的蒙古人通過(guò)手機(jī)錄制的蒙語(yǔ)語(yǔ)音，以及由專(zhuān)業(yè)人員標(biāo)注的蒙語(yǔ)和漢語(yǔ)的文本。為保證數(shù)據(jù)質(zhì)量，對(duì)數(shù)據(jù)進(jìn)行了預(yù)處理，如去除空語(yǔ)音文件、重采樣、歸一化后，最終得到25小時(shí)的高質(zhì)量數(shù)據(jù)，數(shù)據(jù)集中音頻的平均時(shí)長(zhǎng)為4.2秒。本數(shù)據(jù)集的建立為探索面向少數(shù)民族語(yǔ)言的語(yǔ)音翻譯技術(shù)提供了一定的數(shù)據(jù)基礎(chǔ)。

關(guān)鍵詞：語(yǔ)音翻譯；蒙漢；少數(shù)民族語(yǔ)言；低資源；數(shù)據(jù)集

Abstract & Keywords

Abstract:?Due to the lack of public datasets, few researches focus on speech translation in minority languages. Therefore, in this paper we constructed a dataset of Mongolian-Chinese speech translation, named “NMLR-Mon2Chs ST”. The dataset consists of Mongolian speech, Mongolian and Chinese texts. First, the Mongolian speech were recorded from 36 Mongols aged between 20 and 25 by recording the audio on their mobile phones. Then, the corresponding Chinese texts were annotated by professionals. In order to ensure the quality of the dataset, we preprocessed the data in it, such as removing the quiet speech, resampling, and normalization. As a result, a total of 25 hours of high-quality data are obtained, and the average duration of audio in the dataset is 4.2 seconds. This dataset is expected to provide certain data support for the research on the speech translation from minority languages to other languages.

Keywords:?speech translation;?Mongolian-Chinese;?minority languages;?low resource;?dataset

數(shù)據(jù)庫(kù)（集）基本信息簡(jiǎn)介

數(shù)據(jù)庫(kù)（集）名稱	蒙漢語(yǔ)音翻譯數(shù)據(jù)集 (NMLR-Mon2Chs ST)
數(shù)據(jù)作者	戚肖克，特尼格爾，孫媛，趙小兵
數(shù)據(jù)通信作者	趙小兵（nmzxb_cn@163.com）
數(shù)據(jù)時(shí)間范圍	2020年
地理區(qū)域	內(nèi)蒙古自治區(qū)呼和浩特市
數(shù)據(jù)量	1.62 GB
數(shù)據(jù)格式	.wav, .json
數(shù)據(jù)服務(wù)系統(tǒng)網(wǎng)址	http://www.doi.org/10.11922/sciencedb.j00001.00345
基金項(xiàng)目	國(guó)家語(yǔ)委重點(diǎn)項(xiàng)目（ZDI135-118）
數(shù)據(jù)庫(kù)（集）組成	數(shù)據(jù)集共包括2個(gè)數(shù)據(jù)文件，其中，(1) wav.zip 是語(yǔ)音數(shù)據(jù)，包含21478個(gè)音頻文件，總時(shí)長(zhǎng)為25小時(shí)，數(shù)據(jù)量為1.62 GB；(2) text.json是文本數(shù)據(jù)，由音頻文件名、對(duì)應(yīng)的蒙語(yǔ)文本及漢語(yǔ)文本組成，數(shù)據(jù)量為4.9 MB。

Dataset Profile

Title	A dataset of Mongolian-Chinese speech translation
Data corresponding author	ZHAO Xiaobing (nmzxb_cn@163.com)
Data authors	QI Xiaoke, BORJIGIN B. Teniger, SUN Yuan, ZHAO Xiaobing
Time range	2020
Geographical scope	Hohhot, Inner Mongolia
Data volume	1.62 GB
Data format	.zip (.wav), .json
Data service system	<http://www.doi.org/10.11922/sciencedb.j00001.00345>
Source of funding	National Language Commission Project (ZDI135-118)
Dataset composition	The dataset consists of 2 subsets in total. The subsets are recorded as “wav.zip” and “text. json”. The former is made up of audio data, with 21,478 files, a duration of 25 hours, and a data volume of 1.62GB; the latter is made up of text data, with a data volume of 4.9MB, which consists of the name of each speech file, the corresponding Mongolian text and Chinese text.

引言

語(yǔ)音翻譯 (Speech Translation, ST)，又稱為口語(yǔ)翻譯 (Spoken Language Translation, SLT)，它的任務(wù)是將一種語(yǔ)言的語(yǔ)音轉(zhuǎn)換為另一種語(yǔ)言的文本^[1]。語(yǔ)音翻譯是打破人類(lèi)交流語(yǔ)言壁障的一項(xiàng)關(guān)鍵技術(shù)，應(yīng)用較為廣泛，如電影字幕、國(guó)際會(huì)議、旅游輔助等。

語(yǔ)音翻譯技術(shù)建立在自動(dòng)語(yǔ)音識(shí)別 (Automatic Speech Recognition, ASR) 和機(jī)器翻譯 (Machine Translation, MT) 技術(shù)之上。近年來(lái)，隨著計(jì)算機(jī)算力的提升、端到端神經(jīng)網(wǎng)絡(luò)方法的提出、數(shù)據(jù)的劇增等，ASR和MT領(lǐng)域都有了顯著的進(jìn)展，語(yǔ)音翻譯也成為語(yǔ)音信號(hào)處理及自然語(yǔ)言處理領(lǐng)域的一個(gè)研究熱點(diǎn)。

然而，受公開(kāi)的數(shù)據(jù)集限制，目前ST方向的研究大多針對(duì)中英^[2]、英德^[3]、英法^[4]、英日^[5]等語(yǔ)言之間的翻譯，較少機(jī)構(gòu)研究面向少數(shù)民族語(yǔ)言的語(yǔ)音翻譯。為了緩解這一問(wèn)題，本文采集了年齡在20–25歲之間的36位蒙古族人員的語(yǔ)音，并由蒙漢專(zhuān)業(yè)人員標(biāo)注了每個(gè)音頻對(duì)應(yīng)的漢語(yǔ)文本。經(jīng)整合和預(yù)處理后，共得到25小時(shí)的有效蒙語(yǔ)語(yǔ)音數(shù)據(jù)，形成了蒙漢語(yǔ)音翻譯數(shù)據(jù)集NMLR-Mon2Chs ST。本數(shù)據(jù)集不僅可供ST領(lǐng)域研究使用，還可用于ASR、MT、蒙語(yǔ)語(yǔ)音合成、說(shuō)話人識(shí)別等方向的研究。

1 ? 數(shù)據(jù)采集和處理方法

1.1 ? 數(shù)據(jù)采集方法

蒙漢語(yǔ)音翻譯數(shù)據(jù)集（NMLR-Mon2Chs ST）包含語(yǔ)音和文本兩部分?jǐn)?shù)據(jù)。語(yǔ)音數(shù)據(jù)由36位年齡在20–25歲之間的蒙古族說(shuō)話人通過(guò)錄制得到，這些說(shuō)話人均來(lái)自于我國(guó)內(nèi)蒙古自治區(qū)呼和浩特市。首先，準(zhǔn)備蒙語(yǔ)文本，每位錄音人員在安靜的環(huán)境下，通過(guò)手機(jī)朗讀文本的句子，進(jìn)行錄音，朗讀的每句保存為一個(gè)wav格式的語(yǔ)音文件，文件名為朗讀文本中的句序號(hào)，每個(gè)說(shuō)話人的音頻放在一個(gè)單獨(dú)文件夾中。之后，由既懂蒙語(yǔ)又懂漢語(yǔ)的專(zhuān)業(yè)人員對(duì)每個(gè)語(yǔ)音文件標(biāo)注對(duì)應(yīng)的漢語(yǔ)文本。然后，整合語(yǔ)音和文本文件，并對(duì)其進(jìn)行預(yù)處理，最終得到蒙語(yǔ)語(yǔ)音翻譯數(shù)據(jù)集。

1.2 ? 數(shù)據(jù)預(yù)處理方法

從36位錄音人員處收集數(shù)據(jù)，數(shù)據(jù)的形式為每位說(shuō)話人一個(gè)單獨(dú)文件夾，文件夾內(nèi)為以句序號(hào)命名的wav文件及對(duì)應(yīng)的以句序號(hào)命名的蒙文和漢語(yǔ)文本。將此數(shù)據(jù)集稱為原始蒙漢語(yǔ)音翻譯數(shù)據(jù)集，對(duì)此數(shù)據(jù)集進(jìn)行預(yù)處理，經(jīng)過(guò)6個(gè)步驟后，可以得到最終的蒙語(yǔ)語(yǔ)音翻譯數(shù)據(jù)集。具體的預(yù)處理步驟如圖1所示。

圖1 ? 數(shù)據(jù)的預(yù)處理過(guò)程

Figure 1 The process of data preprocessing

第一步，去除空文件。由于說(shuō)話人在錄制過(guò)程中，存在誤觸、錄制失敗等問(wèn)題，導(dǎo)致空語(yǔ)音文件的產(chǎn)生。因此，預(yù)處理首先要去除無(wú)語(yǔ)音數(shù)據(jù)的文件。方法為：設(shè)置一個(gè)閾值，當(dāng)語(yǔ)音音頻時(shí)長(zhǎng)小于閾值時(shí)，認(rèn)為該文件內(nèi)不含有意義的語(yǔ)音數(shù)據(jù)，因此將從數(shù)據(jù)集中刪除該音頻文件。在本數(shù)據(jù)集中，設(shè)置閾值為0.2秒。

第二步，去除非蒙語(yǔ)存在的音頻。在錄制的蒙文文本中，存在非蒙文詞，如2020、King、Uncle、Roger 等。由于數(shù)量較少，在預(yù)處理時(shí)簡(jiǎn)單地將這類(lèi)文本數(shù)據(jù)及對(duì)應(yīng)的語(yǔ)音數(shù)據(jù)從數(shù)據(jù)集中刪除。

第三步，重采樣。由于36位說(shuō)話人在不同的時(shí)間不同的設(shè)備上錄制語(yǔ)音，使得數(shù)據(jù)集中不同的音頻文件采樣率存在區(qū)別，如存在個(gè)別音頻的采樣率為44.1 kHz。為解決這一問(wèn)題，對(duì)所有音頻，重采樣至16 kHz。

第四步，歸一化。由于說(shuō)話人錄音時(shí)音量高低不一致，導(dǎo)致不同音頻信號(hào)間強(qiáng)弱差異較大。本文采用歸一化將語(yǔ)音數(shù)據(jù)歸于[-1,1]范圍內(nèi)，即對(duì)每個(gè)音頻內(nèi)的值

，計(jì)算幅度最大值

，則歸一化后的音頻信號(hào)為

。

第五步，按照一定格式重命名音頻，具體格式描述如第2章所示。

第六步，文本文件重組。原始蒙漢語(yǔ)音翻譯數(shù)據(jù)集中每個(gè)音頻都對(duì)應(yīng)一個(gè)文本文件，不利于數(shù)據(jù)的處理。因此，將所有音頻的文本加入音頻名稱作為文本標(biāo)記，全部整合入一個(gè)文本中，形成最終的文本文件。

2 ? 數(shù)據(jù)樣本描述

本數(shù)據(jù)集為蒙漢語(yǔ)音翻譯數(shù)據(jù)集，數(shù)據(jù)集中包含1個(gè)zip壓縮包和1個(gè)文本文件。其中，壓縮包內(nèi)有一個(gè)名為wav的文件夾，大小為1.61 GB，未壓縮時(shí)大小為2.68 GB。wav文件夾內(nèi)包含36個(gè)子文件夾，每個(gè)子文件夾對(duì)應(yīng)一位錄音人員的語(yǔ)音數(shù)據(jù)，命名規(guī)則為錄音人員的“姓名拼音”與“錄制的音頻的總時(shí)長(zhǎng)（以分鐘為單位）”。例如，子文件夾“ahei40”表示該文件夾下的音頻均為“阿黑”錄制，錄制的語(yǔ)音總時(shí)長(zhǎng)約為40分鐘（由于預(yù)處理過(guò)程中去除了一部分無(wú)效語(yǔ)音，因此最終有效時(shí)長(zhǎng)略小于此處標(biāo)記的值）。子文件夾下為多個(gè)音頻文件，每個(gè)文件的命名格式為“該音頻所在的子文件夾名稱-音頻序號(hào).wav”，如“ahei40-0001.wav”、“ahei40-0002.wav”等。對(duì)本數(shù)據(jù)集中36位錄音人員錄制的音頻文件數(shù)目和音頻總有效時(shí)長(zhǎng)（以分鐘為單位）進(jìn)行統(tǒng)計(jì)，結(jié)果如表1所示。平均每位錄音人員錄制597句，平均有效時(shí)長(zhǎng)41.7分鐘。整個(gè)蒙漢語(yǔ)音翻譯數(shù)據(jù)集中共包含21478個(gè)音頻文件，有效時(shí)長(zhǎng)為25小時(shí)。

表1 ? 36位錄音人員的音頻數(shù)據(jù)統(tǒng)計(jì)表

音頻文件夾名稱	音頻文件數(shù)目	時(shí)長(zhǎng)(分鐘)	音頻文件夾名稱	音頻文件數(shù)目	時(shí)長(zhǎng)(分鐘)
ahei40	589	38.8	qigen46	589	44.6
aliya40	589	38.8	qilemuge56	597	55
aliya42	589	41.1	sarinuo44	600	42.1
aoga55	595	53.1	sulanga42	589	41.5
arigunuo44	596	43.4	tenggeerwurixi47	611	46.1
arunuo54	595	52.2	tugusi49	589	48.5
ayilahu37	600	36.2	tuoya59	597	57.5
ayisi39	596	38.3	wenduer49	611	47.9
batueerdun37	609	36.4	wulijitu46	596	44.5
bayaliga39	596	38.3	wuniritu38	609	37.9
erimujiletu38	587	36.8	wurigumule36	610	35.1
hairihan35	587	34.4	wuyihan32	600	30.9
hasihu26	588	25.2	wuyundalai38	588	37.2
honggeerdelehei38	594	36.9	wuyunqimuge49	610	48.3
hudeer32	593	31	yirigui43	599	42.4
huriwa49	595	48.1	zhagunuo40	611	39.1
jigeqi55	589	53.5	zhalegamuji39	611	38
nandibilige46	586	44.2	zhurihentala38	588	37.1

數(shù)據(jù)集中的文本文件名為text.json，大小為4.9 MB。每個(gè)音頻文件對(duì)應(yīng)文本中的一個(gè)字典，字典中的鍵“filename”“mon”和“chs”分別表示“音頻文件名”“音頻對(duì)應(yīng)的蒙文文本”和“音頻對(duì)應(yīng)的漢語(yǔ)文本”，示例如表2所示。

表2 ? 音頻對(duì)應(yīng)的文本內(nèi)容示例

音頻文件名稱	對(duì)應(yīng)的蒙文文本	對(duì)應(yīng)的漢語(yǔ)文本
ahei40-0001	?????? ???????? ?????? ??????? ???	在門(mén)廳下面
ahei40-0002	?? ??? ????? ???? ?????? ???? ????????	我這就給您拿一些
ahei40-0003	????? ?? ???? ????? ??????????? ??????? ?????? ?????? ??????	如果您還有什么需要盡管告訴我
ahei40-0004	??????? ??????? ?????? ????? ????	不用擔(dān)心那個(gè)
ahei40-0005	?? ?????? ???????? ?????? ?? ?????? ?????? ????? ????	我要買(mǎi)它你不需要把它包起來(lái)
ahei40-0006	?? ?????? ???????? ??	你可以改改嗎
ahei40-0007	?????? ??????? ???? ?? ??????	紅綠燈是紅的
ahei40-0008	???? ?????? ???????? ?????? ???? ??????? ???	我們想要張靠窗戶的桌子
ahei40-0009	????? ??? ???????????? ???????? ?????? ??????? ???	在那邊就在游客信息的前面
ahei40-0010	?? ???? ??????? ??????? ?????? ????????	我打網(wǎng)球時(shí)扭傷的
……	……	……
wuyihan32-3063	?????? ???????? ????? ?????????	把他們放進(jìn)籃里好嗎
wuyihan32-3064	?? ?????? ????? ???????? ??? ??? ????? ??? ???? ?????????	我可以從我的外套拿錢(qián)包嗎
wuyihan32-3065	??? ??????????? ????????? ?????????	有潛水學(xué)校嗎
wuyihan32-3066	?? ????????? ??????? ??? ?? ???? ????? ?? ???? ????????	你能在早上七點(diǎn)把我的包拿下來(lái)嗎
wuyihan32-3067	???? ???????? ???????? ????? ???????????	我們需要付飲料費(fèi)嗎
wuyihan32-3068	?? ?????? ???????	我愛(ài)戈雅
wuyihan32-3069	?? ????? ??? ???????? ?? ???????	我渴望見(jiàn)到它們
wuyihan32-3070	????? ?????? ?????? ????????? ???????? ?????????	有好的賣(mài)皮革制品的商店嗎
wuyihan32-3071	???? ?????? ??????? ???? ???? ???	我的褲子上有條口子
……	……	……

3 ? 數(shù)據(jù)質(zhì)量控制和評(píng)估

本蒙漢語(yǔ)音翻譯數(shù)據(jù)集由36位蒙古族人員在安靜環(huán)境中錄音的音頻文件、對(duì)應(yīng)的蒙語(yǔ)文本以及漢語(yǔ)文本組成，在預(yù)處理階段對(duì)音頻和文本進(jìn)行了質(zhì)量控制，去除了無(wú)效的音頻、非蒙文的句子等，確保數(shù)據(jù)的可靠性。對(duì)音頻時(shí)長(zhǎng)區(qū)間的分布進(jìn)行分析，如圖2所示，圖中的柱狀圖表示不同音頻時(shí)長(zhǎng)區(qū)間在所有音頻中的占比，折線圖為不同音頻時(shí)長(zhǎng)區(qū)間在所有音頻中的累積占比。從圖中可以看出，50.7%的音頻時(shí)長(zhǎng)在2–4秒，97.8%的音頻時(shí)長(zhǎng)在8秒以內(nèi)。同時(shí)，通過(guò)計(jì)算可以得出，本數(shù)據(jù)集中音頻的平均時(shí)長(zhǎng)為4.2秒。

圖2 ? 音頻時(shí)長(zhǎng)區(qū)間分布圖

Figure 2 Distribution illustration of audio duration

4 ? 數(shù)據(jù)價(jià)值

蒙漢語(yǔ)音翻譯數(shù)據(jù)集中的語(yǔ)音來(lái)源于36位蒙古族人員，年齡在20–25歲之間，采用手機(jī)錄制音頻，文本由專(zhuān)門(mén)的人員標(biāo)注，經(jīng)過(guò)整合和預(yù)處理后得到25小時(shí)的可靠數(shù)據(jù)。本數(shù)據(jù)可為蒙漢語(yǔ)音翻譯研究提供數(shù)據(jù)基礎(chǔ)。此外，本數(shù)據(jù)集還可用作蒙語(yǔ)語(yǔ)音識(shí)別、語(yǔ)音合成、說(shuō)話人識(shí)別等任務(wù)的測(cè)試集，同時(shí)也可作為訓(xùn)練集用于研究小樣本下的任務(wù)。例如，蒙語(yǔ)語(yǔ)音和蒙文文本可用于小樣本下的蒙語(yǔ)語(yǔ)音識(shí)別的研究。蒙文文本與漢語(yǔ)文本作為一對(duì)平行語(yǔ)料，可用于小樣本下的蒙漢機(jī)器翻譯的研究。平均每個(gè)說(shuō)話人錄制了約600句音頻，可用于研究小樣本蒙語(yǔ)語(yǔ)音合成或多說(shuō)話人蒙語(yǔ)語(yǔ)音合成算法。語(yǔ)音數(shù)據(jù)按照說(shuō)話人分別存儲(chǔ)在不同的文件夾下，因此，本數(shù)據(jù)集也可用于小樣本下的說(shuō)話人識(shí)別研究。

致謝

獲取本數(shù)據(jù)集得到呼和浩特民族學(xué)院包烏格德勒、斯日古楞的大力支持，在此表示感謝。

[1]

SPERBER M, PAULIK M. Speech translation and the end-to-end promise: taking stock of where we are[C]/Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics. Online. Stroudsburg, PA, USA: Association for Computational Linguistics, 2020. DOI:10.18653/v1/2020.acl-main.661.

+?CSCD?·?Baidu Scholar

[2]

ZHANG R, WANG X, ZHANG C, et al. BSTC: A large-scale Chinese-English speech translation dataset[J]. arXiv preprint arXiv:2104.03575, 2021.

+?CSCD?·?Baidu Scholar

[3]

CATTONI R, DI GANGI M A, BENTIVOGLI L, et al. MuST-C: a multilingual corpus for end-to-end speech translation[J]. Computer Speech & Language, 2021, 66: 101155. DOI: 10.1016/j.csl.2020.101155.

+?CSCD?·?Baidu Scholar

[4]

KOCABIYIKOGLU A C, BESACIER L, KRAIF O. Augmenting librispeech with French translations: a multimodal corpus for direct speech translation evaluation[EB/OL]. 2018: arXiv: 1802.03142[cs.CL]. https://arxiv.org/abs/1802.03142.

+?CSCD?·?Baidu Scholar

[5]

TOHYAMA H, MATSUBARA S, KAWAGUCHI N, et al. Construction and utilization of bilingual speech corpus for simultaneous machine interpretation research[C]/Interspeech 2005. ISCA: ISCA, 2005. DOI:10.21437/interspeech.2005-463.

+?CSCD?·?Baidu Scholar

數(shù)據(jù)引用格式

戚肖克, 特尼格爾, 孫媛, 等. 蒙漢語(yǔ)音翻譯數(shù)據(jù)集[DS/OL]. 中國(guó)科學(xué)數(shù)據(jù), 2022. (2022-01-28). DOI: 10.11922/sciencedb.j00001.00345.

稿件與作者信息

論文引用格式

戚肖克, 特尼格爾, 孫媛, 等. 蒙漢語(yǔ)音翻譯數(shù)據(jù)集[J/OL]. 中國(guó)科學(xué)數(shù)據(jù), 2022, 7(2). (2022-06-25). DOI: 10.11922/11-6035.csd.2021.0093.zh.

戚肖克

QI Xiaoke

主要承擔(dān)工作：數(shù)據(jù)集的預(yù)處理和整合、論文撰寫(xiě)。

（1985—），女，山東省菏澤市人，博士，副教授，研究方向?yàn)檎Z(yǔ)音信號(hào)處理、自然語(yǔ)言處理。

特尼格爾

BORJIGIN B. Teniger

主要承擔(dān)工作：數(shù)據(jù)采集與質(zhì)量控制。

（1990—），男，內(nèi)蒙古自治區(qū)呼和浩特市人，博士研究生，研究方向?yàn)橛?jì)算語(yǔ)言學(xué)。

孫媛

SUN Yuan

主要承擔(dān)工作：數(shù)據(jù)集前期整合。

（1979—），女，山東省濱州市人，博士，副教授，研究方向?yàn)樽匀徽Z(yǔ)言處理。

趙小兵

ZHAO Xiaobing

主要承擔(dān)工作：數(shù)據(jù)質(zhì)量控制與綜合管理。

nmzxb_cn@163.com

（1967—），女，內(nèi)蒙古自治區(qū)呼和浩特市人，博士，教授，研究方向?yàn)樽匀徽Z(yǔ)言處理。

國(guó)家語(yǔ)委重點(diǎn)項(xiàng)目（ZDI135-118）

National Language Commission Project (ZDI135-118)

出版歷史

I區(qū)發(fā)布時(shí)間：2022年1月28日（版本ZH2）

II區(qū)出版時(shí)間：2022年6月28日（版本ZH3）

亚洲欧美日韩精品久久久,夜色福利一区二区三区,视频日韩p影院永久免费,成人免费视频国产