<button id="yg2go"><code id="yg2go"></code></button>
  • <cite id="yg2go"></cite>
  • <abbr id="yg2go"><dl id="yg2go"></dl></abbr>
  • 亚洲欧美日韩精品久久久,夜色福利一区二区三区,视频日韩p影院永久免费,成人免费视频国产

    多語(yǔ)種智能信息處理數(shù)據(jù)集專(zhuān)刊 II 區(qū)論文(已發(fā)表) ? 版本 ZH3 Vol 7 (2) 2022
    下載
    蒙漢語(yǔ)音翻譯數(shù)據(jù)集
    A dataset of Mongolian-Chinese speech translation
    ?>>
    : 2021 - 12 - 21
    : 2022 - 05 - 17
    : 2022 - 01 - 28
    : 2022 - 06 - 28
    4963 12 0
    摘要&關(guān)鍵詞
    摘要:目前,由于缺乏公開(kāi)數(shù)據(jù)集,面向少數(shù)民族語(yǔ)言的語(yǔ)音翻譯的研究較少。為此,本文構(gòu)建并公開(kāi)了蒙語(yǔ)語(yǔ)音到漢語(yǔ)文本語(yǔ)音翻譯數(shù)據(jù)集 (NMLR-Mon2Chs ST)。本數(shù)據(jù)集包含36位年齡在20–25歲之間的蒙古人通過(guò)手機(jī)錄制的蒙語(yǔ)語(yǔ)音,以及由專(zhuān)業(yè)人員標(biāo)注的蒙語(yǔ)和漢語(yǔ)的文本。為保證數(shù)據(jù)質(zhì)量,對(duì)數(shù)據(jù)進(jìn)行了預(yù)處理,如去除空語(yǔ)音文件、重采樣、歸一化后,最終得到25小時(shí)的高質(zhì)量數(shù)據(jù),數(shù)據(jù)集中音頻的平均時(shí)長(zhǎng)為4.2秒。本數(shù)據(jù)集的建立為探索面向少數(shù)民族語(yǔ)言的語(yǔ)音翻譯技術(shù)提供了一定的數(shù)據(jù)基礎(chǔ)。
    關(guān)鍵詞:語(yǔ)音翻譯;蒙漢;少數(shù)民族語(yǔ)言;低資源;數(shù)據(jù)集
    Abstract & Keywords
    Abstract:?Due to the lack of public datasets, few researches focus on speech translation in minority languages. Therefore, in this paper we constructed a dataset of Mongolian-Chinese speech translation, named “NMLR-Mon2Chs ST”. The dataset consists of Mongolian speech, Mongolian and Chinese texts. First, the Mongolian speech were recorded from 36 Mongols aged between 20 and 25 by recording the audio on their mobile phones. Then, the corresponding Chinese texts were annotated by professionals. In order to ensure the quality of the dataset, we preprocessed the data in it, such as removing the quiet speech, resampling, and normalization. As a result, a total of 25 hours of high-quality data are obtained, and the average duration of audio in the dataset is 4.2 seconds. This dataset is expected to provide certain data support for the research on the speech translation from minority languages to other languages.
    Keywords:?speech translation;?Mongolian-Chinese;?minority languages;?low resource;?dataset
    數(shù)據(jù)庫(kù)(集)基本信息簡(jiǎn)介
    數(shù)據(jù)庫(kù)(集)名稱蒙漢語(yǔ)音翻譯數(shù)據(jù)集 (NMLR-Mon2Chs ST)
    數(shù)據(jù)作者戚肖克,特尼格爾,孫媛,趙小兵
    數(shù)據(jù)通信作者趙小兵(nmzxb_cn@163.com)
    數(shù)據(jù)時(shí)間范圍2020年
    地理區(qū)域內(nèi)蒙古自治區(qū)呼和浩特市
    數(shù)據(jù)量1.62 GB
    數(shù)據(jù)格式*.wav, *.json
    數(shù)據(jù)服務(wù)系統(tǒng)網(wǎng)址http://www.doi.org/10.11922/sciencedb.j00001.00345
    基金項(xiàng)目國(guó)家語(yǔ)委重點(diǎn)項(xiàng)目(ZDI135-118)
    數(shù)據(jù)庫(kù)(集)組成數(shù)據(jù)集共包括2個(gè)數(shù)據(jù)文件,其中,(1) wav.zip 是語(yǔ)音數(shù)據(jù),包含21478個(gè)音頻文件,總時(shí)長(zhǎng)為25小時(shí),數(shù)據(jù)量為1.62 GB;(2) text.json是文本數(shù)據(jù),由音頻文件名、對(duì)應(yīng)的蒙語(yǔ)文本及漢語(yǔ)文本組成,數(shù)據(jù)量為4.9 MB。
    Dataset Profile
    TitleA dataset of Mongolian-Chinese speech translation
    Data corresponding authorZHAO Xiaobing (nmzxb_cn@163.com)
    Data authorsQI Xiaoke, BORJIGIN B. Teniger, SUN Yuan, ZHAO Xiaobing
    Time range2020
    Geographical scopeHohhot, Inner Mongolia
    Data volume1.62 GB
    Data format.zip (.wav), .json
    Data service system<http://www.doi.org/10.11922/sciencedb.j00001.00345>
    Source of fundingNational Language Commission Project (ZDI135-118)
    Dataset compositionThe dataset consists of 2 subsets in total. The subsets are recorded as “wav.zip” and “text. json”. The former is made up of audio data, with 21,478 files, a duration of 25 hours, and a data volume of 1.62GB; the latter is made up of text data, with a data volume of 4.9MB, which consists of the name of each speech file, the corresponding Mongolian text and Chinese text.
    引 言
    語(yǔ)音翻譯 (Speech Translation, ST),又稱為口語(yǔ)翻譯 (Spoken Language Translation, SLT),它的任務(wù)是將一種語(yǔ)言的語(yǔ)音轉(zhuǎn)換為另一種語(yǔ)言的文本[1]。語(yǔ)音翻譯是打破人類(lèi)交流語(yǔ)言壁障的一項(xiàng)關(guān)鍵技術(shù),應(yīng)用較為廣泛,如電影字幕、國(guó)際會(huì)議、旅游輔助等。
    語(yǔ)音翻譯技術(shù)建立在自動(dòng)語(yǔ)音識(shí)別 (Automatic Speech Recognition, ASR) 和機(jī)器翻譯 (Machine Translation, MT) 技術(shù)之上。近年來(lái),隨著計(jì)算機(jī)算力的提升、端到端神經(jīng)網(wǎng)絡(luò)方法的提出、數(shù)據(jù)的劇增等,ASR和MT領(lǐng)域都有了顯著的進(jìn)展,語(yǔ)音翻譯也成為語(yǔ)音信號(hào)處理及自然語(yǔ)言處理領(lǐng)域的一個(gè)研究熱點(diǎn)。
    然而,受公開(kāi)的數(shù)據(jù)集限制,目前ST方向的研究大多針對(duì)中英[2]、英德[3]、英法[4]、英日[5]等語(yǔ)言之間的翻譯,較少機(jī)構(gòu)研究面向少數(shù)民族語(yǔ)言的語(yǔ)音翻譯。為了緩解這一問(wèn)題,本文采集了年齡在20–25歲之間的36位蒙古族人員的語(yǔ)音,并由蒙漢專(zhuān)業(yè)人員標(biāo)注了每個(gè)音頻對(duì)應(yīng)的漢語(yǔ)文本。經(jīng)整合和預(yù)處理后,共得到25小時(shí)的有效蒙語(yǔ)語(yǔ)音數(shù)據(jù),形成了蒙漢語(yǔ)音翻譯數(shù)據(jù)集NMLR-Mon2Chs ST。本數(shù)據(jù)集不僅可供ST領(lǐng)域研究使用,還可用于ASR、MT、蒙語(yǔ)語(yǔ)音合成、說(shuō)話人識(shí)別等方向的研究。
    1 ? 數(shù)據(jù)采集和處理方法
    1.1 ? 數(shù)據(jù)采集方法
    蒙漢語(yǔ)音翻譯數(shù)據(jù)集(NMLR-Mon2Chs ST)包含語(yǔ)音和文本兩部分?jǐn)?shù)據(jù)。語(yǔ)音數(shù)據(jù)由36位年齡在20–25歲之間的蒙古族說(shuō)話人通過(guò)錄制得到,這些說(shuō)話人均來(lái)自于我國(guó)內(nèi)蒙古自治區(qū)呼和浩特市。首先,準(zhǔn)備蒙語(yǔ)文本,每位錄音人員在安靜的環(huán)境下,通過(guò)手機(jī)朗讀文本的句子,進(jìn)行錄音,朗讀的每句保存為一個(gè)wav格式的語(yǔ)音文件,文件名為朗讀文本中的句序號(hào),每個(gè)說(shuō)話人的音頻放在一個(gè)單獨(dú)文件夾中。之后,由既懂蒙語(yǔ)又懂漢語(yǔ)的專(zhuān)業(yè)人員對(duì)每個(gè)語(yǔ)音文件標(biāo)注對(duì)應(yīng)的漢語(yǔ)文本。然后,整合語(yǔ)音和文本文件,并對(duì)其進(jìn)行預(yù)處理,最終得到蒙語(yǔ)語(yǔ)音翻譯數(shù)據(jù)集。
    1.2 ? 數(shù)據(jù)預(yù)處理方法
    從36位錄音人員處收集數(shù)據(jù),數(shù)據(jù)的形式為每位說(shuō)話人一個(gè)單獨(dú)文件夾,文件夾內(nèi)為以句序號(hào)命名的wav文件及對(duì)應(yīng)的以句序號(hào)命名的蒙文和漢語(yǔ)文本。將此數(shù)據(jù)集稱為原始蒙漢語(yǔ)音翻譯數(shù)據(jù)集,對(duì)此數(shù)據(jù)集進(jìn)行預(yù)處理,經(jīng)過(guò)6個(gè)步驟后,可以得到最終的蒙語(yǔ)語(yǔ)音翻譯數(shù)據(jù)集。具體的預(yù)處理步驟如圖1所示。


    圖1 ? 數(shù)據(jù)的預(yù)處理過(guò)程
    Figure 1 The process of data preprocessing
    第一步,去除空文件。由于說(shuō)話人在錄制過(guò)程中,存在誤觸、錄制失敗等問(wèn)題,導(dǎo)致空語(yǔ)音文件的產(chǎn)生。因此,預(yù)處理首先要去除無(wú)語(yǔ)音數(shù)據(jù)的文件。方法為:設(shè)置一個(gè)閾值,當(dāng)語(yǔ)音音頻時(shí)長(zhǎng)小于閾值時(shí),認(rèn)為該文件內(nèi)不含有意義的語(yǔ)音數(shù)據(jù),因此將從數(shù)據(jù)集中刪除該音頻文件。在本數(shù)據(jù)集中,設(shè)置閾值為0.2秒。
    第二步,去除非蒙語(yǔ)存在的音頻。在錄制的蒙文文本中,存在非蒙文詞,如2020、King、Uncle、Roger 等。由于數(shù)量較少,在預(yù)處理時(shí)簡(jiǎn)單地將這類(lèi)文本數(shù)據(jù)及對(duì)應(yīng)的語(yǔ)音數(shù)據(jù)從數(shù)據(jù)集中刪除。
    第三步,重采樣。由于36位說(shuō)話人在不同的時(shí)間不同的設(shè)備上錄制語(yǔ)音,使得數(shù)據(jù)集中不同的音頻文件采樣率存在區(qū)別,如存在個(gè)別音頻的采樣率為44.1 kHz。為解決這一問(wèn)題,對(duì)所有音頻,重采樣至16 kHz。
    第四步,歸一化。由于說(shuō)話人錄音時(shí)音量高低不一致,導(dǎo)致不同音頻信號(hào)間強(qiáng)弱差異較大。本文采用歸一化將語(yǔ)音數(shù)據(jù)歸于[-1,1]范圍內(nèi),即對(duì)每個(gè)音頻內(nèi)的值 ,計(jì)算幅度最大值 ,則歸一化后的音頻信號(hào)為
    第五步,按照一定格式重命名音頻,具體格式描述如第2章所示。
    第六步,文本文件重組。原始蒙漢語(yǔ)音翻譯數(shù)據(jù)集中每個(gè)音頻都對(duì)應(yīng)一個(gè)文本文件,不利于數(shù)據(jù)的處理。因此,將所有音頻的文本加入音頻名稱作為文本標(biāo)記,全部整合入一個(gè)文本中,形成最終的文本文件。
    2 ? 數(shù)據(jù)樣本描述
    本數(shù)據(jù)集為蒙漢語(yǔ)音翻譯數(shù)據(jù)集,數(shù)據(jù)集中包含1個(gè)zip壓縮包和1個(gè)文本文件。其中,壓縮包內(nèi)有一個(gè)名為wav的文件夾,大小為1.61 GB,未壓縮時(shí)大小為2.68 GB。wav文件夾內(nèi)包含36個(gè)子文件夾,每個(gè)子文件夾對(duì)應(yīng)一位錄音人員的語(yǔ)音數(shù)據(jù),命名規(guī)則為錄音人員的“姓名拼音”與“錄制的音頻的總時(shí)長(zhǎng)(以分鐘為單位)”。例如,子文件夾“ahei40”表示該文件夾下的音頻均為“阿黑”錄制,錄制的語(yǔ)音總時(shí)長(zhǎng)約為40分鐘(由于預(yù)處理過(guò)程中去除了一部分無(wú)效語(yǔ)音,因此最終有效時(shí)長(zhǎng)略小于此處標(biāo)記的值)。子文件夾下為多個(gè)音頻文件,每個(gè)文件的命名格式為“該音頻所在的子文件夾名稱-音頻序號(hào).wav”,如“ahei40-0001.wav”、“ahei40-0002.wav”等。對(duì)本數(shù)據(jù)集中36位錄音人員錄制的音頻文件數(shù)目和音頻總有效時(shí)長(zhǎng)(以分鐘為單位)進(jìn)行統(tǒng)計(jì),結(jié)果如表1所示。平均每位錄音人員錄制597句,平均有效時(shí)長(zhǎng)41.7分鐘。整個(gè)蒙漢語(yǔ)音翻譯數(shù)據(jù)集中共包含21478個(gè)音頻文件,有效時(shí)長(zhǎng)為25小時(shí)。
    表1 ? 36位錄音人員的音頻數(shù)據(jù)統(tǒng)計(jì)表
    音頻文件夾名稱音頻文件數(shù)目時(shí)長(zhǎng)(分鐘)音頻文件夾名稱音頻文件數(shù)目時(shí)長(zhǎng)(分鐘)
    ahei4058938.8qigen4658944.6
    aliya4058938.8qilemuge5659755
    aliya4258941.1sarinuo4460042.1
    aoga5559553.1sulanga4258941.5
    arigunuo4459643.4tenggeerwurixi4761146.1
    arunuo5459552.2tugusi4958948.5
    ayilahu3760036.2tuoya5959757.5
    ayisi3959638.3wenduer4961147.9
    batueerdun3760936.4wulijitu4659644.5
    bayaliga3959638.3wuniritu3860937.9
    erimujiletu3858736.8wurigumule3661035.1
    hairihan3558734.4wuyihan3260030.9
    hasihu2658825.2wuyundalai3858837.2
    honggeerdelehei3859436.9wuyunqimuge4961048.3
    hudeer3259331yirigui4359942.4
    huriwa4959548.1zhagunuo4061139.1
    jigeqi5558953.5zhalegamuji3961138
    nandibilige4658644.2zhurihentala3858837.1
    數(shù)據(jù)集中的文本文件名為text.json,大小為4.9 MB。每個(gè)音頻文件對(duì)應(yīng)文本中的一個(gè)字典,字典中的鍵“filename”“mon”和“chs”分別表示“音頻文件名”“音頻對(duì)應(yīng)的蒙文文本”和“音頻對(duì)應(yīng)的漢語(yǔ)文本”,示例如表2所示。
    表2 ? 音頻對(duì)應(yīng)的文本內(nèi)容示例
    音頻文件名稱對(duì)應(yīng)的蒙文文本對(duì)應(yīng)的漢語(yǔ)文本
    ahei40-0001?????? ???????? ?????? ??????? ???在門(mén)廳下面
    ahei40-0002?? ??? ????? ???? ?????? ???? ????????我這就給您拿一些
    ahei40-0003????? ?? ???? ????? ??????????? ??????? ?????? ?????? ??????如果您還有什么需要 盡管告訴我
    ahei40-0004??????? ??????? ?????? ????? ????不用擔(dān)心那個(gè)
    ahei40-0005?? ?????? ???????? ?????? ?? ?????? ?????? ????? ????我要買(mǎi)它 你不需要把它包起來(lái)
    ahei40-0006?? ?????? ???????? ??你可以改改嗎
    ahei40-0007?????? ??????? ???? ?? ??????紅綠燈是紅的
    ahei40-0008???? ?????? ???????? ?????? ???? ??????? ???我們想要張靠窗戶的桌子
    ahei40-0009????? ??? ???????????? ???????? ?????? ??????? ???在那邊 就在游客信息的前面
    ahei40-0010?? ???? ??????? ??????? ?????? ????????我打網(wǎng)球時(shí)扭傷的
    ………………
    wuyihan32-3063?????? ???????? ????? ?????????把他們放進(jìn)籃里好嗎
    wuyihan32-3064?? ?????? ????? ???????? ??? ??? ????? ??? ???? ?????????我可以從我的外套拿錢(qián)包嗎
    wuyihan32-3065??? ??????????? ????????? ?????????有潛水學(xué)校嗎
    wuyihan32-3066?? ????????? ??????? ??? ?? ???? ????? ?? ???? ????????你能在早上七點(diǎn)把我的包拿下來(lái)嗎
    wuyihan32-3067???? ???????? ???????? ????? ???????????我們需要付飲料費(fèi)嗎
    wuyihan32-3068?? ?????? ???????我愛(ài)戈雅
    wuyihan32-3069?? ????? ??? ???????? ?? ???????我渴望見(jiàn)到它們
    wuyihan32-3070????? ?????? ?????? ????????? ???????? ?????????有好的賣(mài)皮革制品的商店嗎
    wuyihan32-3071???? ?????? ??????? ???? ???? ???我的褲子上有條口子
    ………………
    3 ? 數(shù)據(jù)質(zhì)量控制和評(píng)估
    本蒙漢語(yǔ)音翻譯數(shù)據(jù)集由36位蒙古族人員在安靜環(huán)境中錄音的音頻文件、對(duì)應(yīng)的蒙語(yǔ)文本以及漢語(yǔ)文本組成,在預(yù)處理階段對(duì)音頻和文本進(jìn)行了質(zhì)量控制,去除了無(wú)效的音頻、非蒙文的句子等,確保數(shù)據(jù)的可靠性。對(duì)音頻時(shí)長(zhǎng)區(qū)間的分布進(jìn)行分析,如圖2所示,圖中的柱狀圖表示不同音頻時(shí)長(zhǎng)區(qū)間在所有音頻中的占比,折線圖為不同音頻時(shí)長(zhǎng)區(qū)間在所有音頻中的累積占比。從圖中可以看出,50.7%的音頻時(shí)長(zhǎng)在2–4秒,97.8%的音頻時(shí)長(zhǎng)在8秒以內(nèi)。同時(shí),通過(guò)計(jì)算可以得出,本數(shù)據(jù)集中音頻的平均時(shí)長(zhǎng)為4.2秒。


    圖2 ? 音頻時(shí)長(zhǎng)區(qū)間分布圖
    Figure 2 Distribution illustration of audio duration
    4 ? 數(shù)據(jù)價(jià)值
    蒙漢語(yǔ)音翻譯數(shù)據(jù)集中的語(yǔ)音來(lái)源于36位蒙古族人員,年齡在20–25歲之間,采用手機(jī)錄制音頻,文本由專(zhuān)門(mén)的人員標(biāo)注,經(jīng)過(guò)整合和預(yù)處理后得到25小時(shí)的可靠數(shù)據(jù)。本數(shù)據(jù)可為蒙漢語(yǔ)音翻譯研究提供數(shù)據(jù)基礎(chǔ)。此外,本數(shù)據(jù)集還可用作蒙語(yǔ)語(yǔ)音識(shí)別、語(yǔ)音合成、說(shuō)話人識(shí)別等任務(wù)的測(cè)試集,同時(shí)也可作為訓(xùn)練集用于研究小樣本下的任務(wù)。例如,蒙語(yǔ)語(yǔ)音和蒙文文本可用于小樣本下的蒙語(yǔ)語(yǔ)音識(shí)別的研究。蒙文文本與漢語(yǔ)文本作為一對(duì)平行語(yǔ)料,可用于小樣本下的蒙漢機(jī)器翻譯的研究。平均每個(gè)說(shuō)話人錄制了約600句音頻,可用于研究小樣本蒙語(yǔ)語(yǔ)音合成或多說(shuō)話人蒙語(yǔ)語(yǔ)音合成算法。語(yǔ)音數(shù)據(jù)按照說(shuō)話人分別存儲(chǔ)在不同的文件夾下,因此,本數(shù)據(jù)集也可用于小樣本下的說(shuō)話人識(shí)別研究。
    致 謝
    獲取本數(shù)據(jù)集得到呼和浩特民族學(xué)院包烏格德勒、斯日古楞的大力支持,在此表示感謝。
    [1]
    SPERBER M, PAULIK M. Speech translation and the end-to-end promise: taking stock of where we are[C]/Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics. Online. Stroudsburg, PA, USA: Association for Computational Linguistics, 2020. DOI:10.18653/v1/2020.acl-main.661.
    [2]
    ZHANG R, WANG X, ZHANG C, et al. BSTC: A large-scale Chinese-English speech translation dataset[J]. arXiv preprint arXiv:2104.03575, 2021.
    [3]
    CATTONI R, DI GANGI M A, BENTIVOGLI L, et al. MuST-C: a multilingual corpus for end-to-end speech translation[J]. Computer Speech & Language, 2021, 66: 101155. DOI: 10.1016/j.csl.2020.101155.
    [4]
    KOCABIYIKOGLU A C, BESACIER L, KRAIF O. Augmenting librispeech with French translations: a multimodal corpus for direct speech translation evaluation[EB/OL]. 2018: arXiv: 1802.03142[cs.CL]. https://arxiv.org/abs/1802.03142.
    [5]
    TOHYAMA H, MATSUBARA S, KAWAGUCHI N, et al. Construction and utilization of bilingual speech corpus for simultaneous machine interpretation research[C]/Interspeech 2005. ISCA: ISCA, 2005. DOI:10.21437/interspeech.2005-463.
    數(shù)據(jù)引用格式
    戚肖克, 特尼格爾, 孫媛, 等. 蒙漢語(yǔ)音翻譯數(shù)據(jù)集[DS/OL]. 中國(guó)科學(xué)數(shù)據(jù), 2022. (2022-01-28). DOI: 10.11922/sciencedb.j00001.00345.
    稿件與作者信息
    論文引用格式
    戚肖克, 特尼格爾, 孫媛, 等. 蒙漢語(yǔ)音翻譯數(shù)據(jù)集[J/OL]. 中國(guó)科學(xué)數(shù)據(jù), 2022, 7(2). (2022-06-25). DOI: 10.11922/11-6035.csd.2021.0093.zh.
    戚肖克
    QI Xiaoke
    主要承擔(dān)工作:數(shù)據(jù)集的預(yù)處理和整合、論文撰寫(xiě)。
    (1985—),女,山東省菏澤市人,博士,副教授,研究方向?yàn)檎Z(yǔ)音信號(hào)處理、自然語(yǔ)言處理。
    特尼格爾
    BORJIGIN B. Teniger
    主要承擔(dān)工作:數(shù)據(jù)采集與質(zhì)量控制。
    (1990—),男,內(nèi)蒙古自治區(qū)呼和浩特市人,博士研究生,研究方向?yàn)橛?jì)算語(yǔ)言學(xué)。
    孫媛
    SUN Yuan
    主要承擔(dān)工作:數(shù)據(jù)集前期整合。
    (1979—),女,山東省濱州市人,博士,副教授,研究方向?yàn)樽匀徽Z(yǔ)言處理。
    趙小兵
    ZHAO Xiaobing
    主要承擔(dān)工作:數(shù)據(jù)質(zhì)量控制與綜合管理。
    nmzxb_cn@163.com
    (1967—),女,內(nèi)蒙古自治區(qū)呼和浩特市人,博士,教授,研究方向?yàn)樽匀徽Z(yǔ)言處理。
    國(guó)家語(yǔ)委重點(diǎn)項(xiàng)目(ZDI135-118)
    National Language Commission Project (ZDI135-118)
    出版歷史
    I區(qū)發(fā)布時(shí)間:2022年1月28日 ( 版本ZH2
    II區(qū)出版時(shí)間:2022年6月28日 ( 版本ZH3
    參考文獻(xiàn)列表中查看
    中國(guó)科學(xué)數(shù)據(jù)
    csdata