成人网在线播放,正在播放乱人伦,久久国产影视,久霸tv高端在线观看,国产亚洲福利,精品在线播放视频,在线观看国产www

您的位置:健客網(wǎng) > 精神病頻道 > 精神疾病 > 老年癡呆 > MIT開(kāi)發(fā)聽(tīng)覺(jué)神經(jīng)網(wǎng)絡(luò )模型,學(xué)會(huì )從2秒片段識別音樂(lè )類(lèi)型

MIT開(kāi)發(fā)聽(tīng)覺(jué)神經(jīng)網(wǎng)絡(luò )模型,學(xué)會(huì )從2秒片段識別音樂(lè )類(lèi)型

2018-05-15 來(lái)源:神經(jīng)科技   標簽: 掌上醫生 喝茶減肥 一天瘦一斤 安全減肥 cps聯(lián)盟 美容護膚
摘要:該模型由許多信息處理單元組成,通過(guò)輸入大量的數據來(lái)訓練此模型,以完成特定的任務(wù)。研究人員利用該模型來(lái)闡明人腦是如何執行同樣的任務(wù)的。

【新智元導讀】麻省理工學(xué)院(MIT)的研究人員利用機器學(xué)習算法中的深度神經(jīng)網(wǎng)絡(luò ),創(chuàng )造出了第一個(gè)可以在識別音樂(lè )類(lèi)型等聽(tīng)覺(jué)任務(wù)上模擬人類(lèi)表現的模型。

該模型由許多信息處理單元組成,通過(guò)輸入大量的數據來(lái)訓練此模型,以完成特定的任務(wù)。研究人員利用該模型來(lái)闡明人腦是如何執行同樣的任務(wù)的。

JoshMcDermott說(shuō):“這些模型第一次給我們提供一個(gè)能夠執行對人類(lèi)有意義的感官任務(wù)的機器系統,并且是在人類(lèi)的水平等級上進(jìn)行這項工作。”他是麻省理工學(xué)院大腦和認知科學(xué)系的神經(jīng)科學(xué)FrederickA.和CaroleJ.Middleton的助理教授,也是這項研究的資深作者。“從歷史上看,這種感官的處理方式很難理解,部分原因是我們沒(méi)有一個(gè)非常明確的理論基礎,也沒(méi)有一個(gè)很好的方法來(lái)對可能正在發(fā)生的事情進(jìn)行開(kāi)發(fā)建模。”

這項研究發(fā)表在4月19日的《Neuron》雜志上,這項研究也證明了人類(lèi)的聽(tīng)覺(jué)皮層排列在在一個(gè)等級分明的組織中,就像視覺(jué)皮質(zhì)一樣。在這種類(lèi)型的排列中,感官信息經(jīng)過(guò)連續的處理,基本信息處理得更早,而像單詞含義一樣的更高級特征在后期處理。

麻省理工學(xué)院研究生AlexanderKell和斯坦福大學(xué)助理教授DanielYamins是論文的主要作者。其他作者是麻省理工學(xué)院前訪(fǎng)問(wèn)學(xué)生EricaShook和前麻省理工學(xué)院博士后SamNormanHaignere。

腦建模:模型學(xué)會(huì )了像人類(lèi)一樣準確地執行任務(wù)

當神經(jīng)網(wǎng)絡(luò )在20世紀80年代首次出現時(shí),神經(jīng)科學(xué)家們希望這種系統可以用來(lái)模擬人腦。然而,來(lái)自那個(gè)時(shí)代的計算機不夠強大,無(wú)法建立足夠大的模型來(lái)進(jìn)行一些實(shí)際任務(wù),如物體識別或語(yǔ)音識別等。

在過(guò)去的五年里,隨著(zhù)計算能力和神經(jīng)網(wǎng)絡(luò )技術(shù)的進(jìn)步,使用神經(jīng)網(wǎng)絡(luò )來(lái)執行這些困難的現實(shí)任務(wù)已經(jīng)成為一種可能,而且它們已經(jīng)成為許多工程應用程序中的標準方法。與此同時(shí),一些神經(jīng)科學(xué)家對這些系統是否能夠來(lái)模擬人腦進(jìn)行了重新審視。

Kell說(shuō):“這對于神經(jīng)科學(xué)來(lái)說(shuō)是一個(gè)激動(dòng)人心的機會(huì ),因為我們可以創(chuàng )造出可以代替人類(lèi)來(lái)執行某些工作的系統,然后我們可以對這些模型進(jìn)行測試并將它們與大腦進(jìn)行比較。”

麻省理工學(xué)院的研究人員訓練他們的神經(jīng)網(wǎng)絡(luò )來(lái)執行兩個(gè)聽(tīng)覺(jué)任務(wù),一個(gè)涉及語(yǔ)音,另一個(gè)涉及音樂(lè )。在語(yǔ)音任務(wù)中,研究人員給模型提供了成千上萬(wàn)的兩秒鐘長(cháng)的錄音。任務(wù)是識別音頻中單詞。在音樂(lè )任務(wù)中,該模型被要求識別那些兩秒鐘音樂(lè )片段的類(lèi)型。每個(gè)片段還包括背景噪音,使任務(wù)更加現實(shí)也更加困難。

在完成了成千上萬(wàn)的數據訓練之后,模型學(xué)會(huì )了像人類(lèi)一樣準確地執行任務(wù)。

Kell說(shuō):“這個(gè)想法是隨著(zhù)時(shí)間的推移,模型在任務(wù)中變得越來(lái)越好。希望它正在學(xué)習一些一般的東西,所以如果你給模型輸入一種它以前從未聽(tīng)過(guò)的新聲音,它會(huì )做得很好,這已經(jīng)在實(shí)驗中得到了證明。”

該模型還傾向于在人類(lèi)最容易犯錯誤的片段上犯錯誤。

組成神經(jīng)網(wǎng)絡(luò )的處理單元可以以多種方式組合在一起,形成可以影響模型的性能的不同模型結構。

麻省理工研究團隊發(fā)現,這兩項任務(wù)的最佳模型是將處理分為兩組階段。第一階段是在任務(wù)之間共享的,但在此之后,它分成兩個(gè)分支,用于進(jìn)一步的分析:一個(gè)用于語(yǔ)音處理任務(wù),另一個(gè)用于音樂(lè )處理任務(wù)。

分級的證據:初級聽(tīng)覺(jué)皮層和其他有區別

然后,研究人員用他們的模型對一個(gè)長(cháng)期存在的關(guān)于聽(tīng)覺(jué)皮層結構的問(wèn)題進(jìn)行了探索:它是否分級。

在分級系統中,一系列的大腦區域在流經(jīng)系統的感官信息上執行不同類(lèi)型的計算。有證據表明,視覺(jué)皮層有相同類(lèi)型的組織結構。前期的區域,被稱(chēng)為初級視覺(jué)皮質(zhì),對簡(jiǎn)單的特征如顏色或方向做出反應。后端的區域則執行更復雜的任務(wù),如對象識別。

然而,很難測試這種類(lèi)型的組織是否也存在于聽(tīng)覺(jué)皮層中,部分原因是沒(méi)有一個(gè)好的模型來(lái)對人類(lèi)的聽(tīng)覺(jué)行為進(jìn)行復制。

McDermott說(shuō):“我們認為,如果我們可以構建一個(gè)和人類(lèi)執行同樣任務(wù)的模型,我們就能夠比較將模型不同階段的不同部分與大腦進(jìn)行比價(jià),這樣可以得到一些證據來(lái)證明大腦中的一些部分是否是分級的組織。”

研究人員發(fā)現,在他們的模型中聲音的基本特征,如頻率在早期階段更容易被提取。當信息在神經(jīng)網(wǎng)上不斷向后傳輸的過(guò)程中,一些基本特征越來(lái)越難提取,而更高層次的信息,例如詞的含義變得更容易提取。

為了驗證模型階段是否可以復制人類(lèi)聽(tīng)覺(jué)皮層處理聲音信息的方式,研究人員使用了功能性磁共振成像(fMRI)來(lái)測量大腦處理真實(shí)聲音時(shí)聽(tīng)覺(jué)皮層的不同區域。然后,他們比較了在處理相同的聲音時(shí),大腦和模型的區別。

他們發(fā)現,模型的中間階段與大腦初級聽(tīng)覺(jué)皮層的活動(dòng)相似性最高,隨后的網(wǎng)絡(luò )與初級皮質(zhì)以外的活動(dòng)相呼應。研究人員說(shuō),這為聽(tīng)覺(jué)皮層以一種類(lèi)似于視覺(jué)皮層的分級方式排列提供了證據。

McDermott說(shuō):“我們非常清楚地看到,初級聽(tīng)覺(jué)皮層和其他所有東西之間的區別。”

作者現在打算開(kāi)發(fā)一種可以執行其他類(lèi)型的聽(tīng)覺(jué)任務(wù)的模型,例如特定聲音的發(fā)聲位置定位,來(lái)探討這些任務(wù)是否可以通過(guò)本文中發(fā)現的思路來(lái)完成,或者說(shuō)其他的一些任務(wù)通過(guò)對人腦進(jìn)行研究,以獲得新的思路。

 

看本篇文章的人在健客購買(mǎi)了以下產(chǎn)品 更多>
有健康問(wèn)題?醫生在線(xiàn)免費幫您解答!去提問(wèn)>>
健客微信
健客藥房
唐河县| 长宁县| 海晏县| 左权县| 嘉鱼县| 司法| 交口县| 普陀区| 肇东市| 桐乡市| 台中县| 松阳县| 清涧县| 淅川县| 锦屏县| 缙云县| 菏泽市| 南华县| 桐乡市| 上虞市| 湖口县| 乐昌市| 阜新| 皮山县| 抚顺县| 新野县| 鲁山县| 利川市| 金坛市| 手机| 东乡族自治县| 六安市| 原平市| 重庆市| 大英县| 钟山县| 洪洞县| 邵东县| 新河县| 年辖:市辖区| 南投市|