成人国产在线免播放器最近|久久免费视频2000|日韩精品亚洲精品中文字幕乱伦AV|五月丁香乱伦图一本AV不卡1区

手機(jī)號(hào)
驗(yàn)證碼
立即登錄    忘記密碼? 注冊(cè)
手機(jī)號(hào)
郵箱
立即登錄    免費(fèi)注冊(cè) 找回密碼

4/25/2018 3:57:00 PM

機(jī)器翻譯是如何執(zhí)行的?原理是什么?

近年來(lái),機(jī)器翻譯有了長(zhǎng)足的進(jìn)步,這是自然語(yǔ)言處理與人工智能的一次重大飛躍。

所謂的機(jī)器翻譯可以看作是如下這張圖:

我們的翻譯機(jī)器就是其中帶有問(wèn)號(hào)的黑箱,它的作用就是能夠?qū)⒁粋€(gè)語(yǔ)言的序列(如Economic growth has slowed down in recent years)轉(zhuǎn)化成目標(biāo)語(yǔ)言序列(如La croissance economique sest ralentie ces dernieres annees)。其中翻譯機(jī)器在正式工作之前可以利用已有的語(yǔ)料庫(kù)(Corpora)來(lái)進(jìn)行學(xué)習(xí)和訓(xùn)練。

所謂的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯就是利用神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)上述的黑箱翻譯機(jī)器?;谏窠?jīng)網(wǎng)絡(luò)的很多技術(shù)都是從Bengio的那篇開(kāi)創(chuàng)性論文(一種神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型)衍生出來(lái)的。它的架構(gòu)如下圖所示:

其中,我們用一個(gè)神經(jīng)網(wǎng)絡(luò)替換了上圖中的黑箱。在神經(jīng)網(wǎng)絡(luò)中存在著大量的鏈接權(quán)重,這些權(quán)重就是我們要通過(guò)數(shù)據(jù)訓(xùn)練、學(xué)習(xí)的參數(shù)。訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)可以將輸入的源語(yǔ)言轉(zhuǎn)換為輸出的目標(biāo)語(yǔ)言。我們要讓神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的目標(biāo)就是要能準(zhǔn)確的翻譯。這里的準(zhǔn)確是指機(jī)器生成的語(yǔ)句是比較符合我們?nèi)祟惖恼f(shuō)話習(xí)慣的。這里的log p(f|e)就是指給定源語(yǔ)言后機(jī)器所產(chǎn)生的語(yǔ)言f的概率,我們希望這個(gè)概率對(duì)于實(shí)際的數(shù)據(jù)來(lái)說(shuō)越大越好,這就是所謂的語(yǔ)言模型。

基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯模型的一個(gè)最大的優(yōu)點(diǎn)就在于它不需要我們用復(fù)雜的特征工程去設(shè)計(jì)其過(guò)程中的環(huán)節(jié),也就是所謂的End2End(端到端)的模型。這種模型設(shè)計(jì)還可以避免中間環(huán)節(jié)的誤差累計(jì)。



閱讀文章:積分+1