|
|
|
| |
|
谷歌輔助翻譯系統(tǒng) Google Translator Toolkit 使用指南
谷歌輔助翻譯系統(tǒng)簡(jiǎn)介
2009年6月,Google 公司發(fā)布了在線計(jì)算機(jī)輔助翻譯平臺(tái)(Online Computer Aided Translation System):Google Translator Toolkit(以下簡(jiǎn)稱GTT)。這是繼嵌入式CAT、獨(dú)立式CAT之后的一個(gè)比較成熟的在線CAT系統(tǒng)。
GTT的鏈接是: http://translate.google.com/toolkit
從外表來看,GTT秉承了 Google 產(chǎn)品一貫的簡(jiǎn)單實(shí)用風(fēng)格,管理界面一目了然,GTT采用左右布局,功能鍵位于上方,見下圖:
谷歌輔助翻譯系統(tǒng) Google Translator Toolkit的管理界面
左側(cè)的控制欄分別是:
All translations(翻譯件) Active(活躍文件) Hidden(隱藏文件) Trash(垃圾桶) Shared with...(分享)
All translation tools(翻譯工具) Translation memories(翻譯記憶) Glossaries(術(shù)語) 如下圖所示:
GTT支持從英文到其他50多種語言的翻譯。這個(gè)平臺(tái)整合了谷歌翻譯(Google Translate)、所見即所得(WYSIWYG)編輯器、開放的評(píng)定系統(tǒng)、分享系統(tǒng)、維基百科以及Knol。
目前,GTT的翻譯件支持一些常見的文件類型,包括:網(wǎng)頁文件HTML (.html), Word文件 (.doc), Openoffice文件 (.odt), 文本文件 (.txt), 富文本文件(.rtf)格式,文件的大小限制在1MB之內(nèi)。
GTT的翻譯工具主要是翻譯記憶工具(Translation memories)和術(shù)語工具(Glossaries),輔助工具是Google原有的機(jī)器翻譯工具(Google Translate)和詞典(Dictionary)。 在翻譯過程中,如果打開Toolkit(快捷鍵Ctrl+O), 這四個(gè)工具都會(huì)顯示在屏幕下方,對(duì)譯者進(jìn)行提示,其中:
1). Translation Search Results(翻譯搜索結(jié)果)是搜索翻譯記憶的結(jié)果。 2). Glossary(術(shù)語)是搜索術(shù)語庫(kù)的結(jié)果。 3). Computer Translation(機(jī)器翻譯結(jié)果)是Google Translate自動(dòng)翻譯的結(jié)果。 4). Dictionary(詞典)可供譯者查詞。
GTT翻譯界面見下圖:
谷歌輔助翻譯系統(tǒng) Google Translator Toolkit的翻譯界面
谷歌輔助翻譯系統(tǒng)入門
1.準(zhǔn)備翻譯術(shù)語庫(kù) GTT的一個(gè)術(shù)語庫(kù)支持多種語言,且支持詞性和釋義。GTT術(shù)語庫(kù)的制作步驟由google來完成,需要譯者做的工作只是準(zhǔn)備一個(gè)csv格式的術(shù)語對(duì)照文件(小于1MB),然后上傳即可。
GTT對(duì)這個(gè)csv文件有特定的要求: A. 術(shù)語按語言逐列排列 B. csv文件的第一行的區(qū)域代碼必須正確。對(duì)于中-英翻譯而言,英文的區(qū)域代碼是en, 簡(jiǎn)體中文的區(qū)域代碼是zh-hans。 簡(jiǎn)便起見,我們只制作一個(gè)簡(jiǎn)單的英文-簡(jiǎn)體中文的術(shù)語表,不標(biāo)明詞性和釋義,如下圖。
準(zhǔn)備安csv文件之后,點(diǎn)擊Glossaries, -> Add,
出現(xiàn)上傳對(duì)話框,如下圖,選擇剛才做好的csv文件,上傳后的文件可以重新命名,準(zhǔn)備妥當(dāng)后可點(diǎn)擊Upload glossary。
上傳完畢后,Google也在后臺(tái)完成了術(shù)語庫(kù)的制作,顯示在我們面前的就是剛才命名的那個(gè)術(shù)語文件,如下圖:
譯者可以選擇把這個(gè)文件與其它人共享,如下圖:
2. 準(zhǔn)備翻譯記憶庫(kù)
GTT支持翻譯記憶交換文件(.tmx),即Translation Memory eXchange文件。文件的大小限制在50MB之內(nèi)。 使用過trados或dejavux的譯者應(yīng)該對(duì)此比較熟悉?梢灾苯訌倪@些CAT軟件中把翻譯記憶直接導(dǎo)出成tmx文件,上傳即可。
不過即使沒有TMX文件也不用害怕,對(duì)于那些沒有使用過CAT軟件的譯者,即使沒有tmx文件也可以照常使用GTT。GTT提供了一個(gè)“公共翻譯記憶庫(kù)”,叫做Global shared TM。我們直接使用這個(gè)“公共翻譯記憶庫(kù)”即可。
3. 準(zhǔn)備待翻譯件 回到GTT的管理界面,點(diǎn)擊“Active”,再點(diǎn)擊”Add”,彈出對(duì)話框,如下圖:
選擇要翻譯的文件(test.txt),選擇原文(English)和譯文(Chinese(Simplified)),然后使用Global shared TM和剛才上傳的glossary術(shù)語庫(kù),上傳。
準(zhǔn)備工作到此結(jié)束,下面開始翻譯
4. 翻譯
在翻譯管理界面下點(diǎn)擊剛才上傳的這個(gè)test.txt文件,彈出翻譯界面,如下圖:
在默認(rèn)的情況下,GTT會(huì)先用Google Translate自動(dòng)把原文翻譯一遍,并把結(jié)果一一對(duì)照地顯示在右側(cè)的譯文欄中。如果想修改這一設(shè)置,需要點(diǎn)擊右上角的Settings, 在彈出界面中選擇: Pre-fill with machine translation instead of source text(預(yù)填入機(jī)器翻譯譯文,而不是原文) Pre-fill with source text instead of machine translation(預(yù)填入原文,而不是機(jī)器翻譯譯文)
在默認(rèn)的情況下Toolkit不是自動(dòng)顯示的,需要點(diǎn)擊Show toolkit打開,如下圖。
點(diǎn)擊“Next”翻譯下一句,或點(diǎn)擊“Previous”修訂上面已經(jīng)翻譯過的譯文。譯者也可以直接點(diǎn)擊某一句譯文,進(jìn)行修訂。
在翻譯過程中,如果想臨時(shí)改變TM或glossary,可以點(diǎn)擊右下方的Edit->Properties進(jìn)行修改。如下圖:
在“視圖(Views)”下可以進(jìn)行其它操作,如:添加注釋(View->Comments)操作,如下圖:
此外,還可以修改完全匹配的顯示(Gray out exact matches)、隱藏編輯框(Hide edit box)、拖動(dòng)編輯框及水平或垂直顯示原文和譯文等,如下圖:
在“編輯(Edit)”界面下還可以進(jìn)行“查找和替換”(Find and replace)操作。如下圖:
下面幾個(gè)截圖是打開Toolkit后的四個(gè)選項(xiàng):Translation Search Results(翻譯搜索結(jié)果),Glossary(術(shù)語),Computer Translation(機(jī)器翻譯結(jié)果),Dictionary(詞典)。
總結(jié)
GTT平臺(tái)是一個(gè)在線CAT平臺(tái),但是融合了Google的機(jī)器翻譯工具(Google Translate)和詞典(Dictionary),譯者可以在同一個(gè)界面下完成翻譯、查詞、TM查詢、術(shù)語查詢的工作,大大方便了譯者。
GTT平臺(tái)具有分享功能,可以讓多名譯者協(xié)同翻譯,有助于團(tuán)隊(duì)協(xié)作,最為重要的是:這種協(xié)作是免費(fèi)的。對(duì)于譯者和小公司而言,這個(gè)免費(fèi)的午餐要比目前的各大CAT生產(chǎn)商Group版動(dòng)則幾十萬的漫天要價(jià)現(xiàn)實(shí)得多。
對(duì)于翻譯來源,除了本文提到的文件上傳方式以外,譯者還可以直接通過URL地址獲取。此外,GTT還提供了直接從 Wikipedia 和 Knol(Google的百科全書)進(jìn)行翻譯的功能。后面幾種功能對(duì)于真正的譯者而言沒有太大的實(shí)用性(因?yàn)橐幻苑g為生的人不會(huì)花太多時(shí)間去做公益事情),但是對(duì)于熱于奉獻(xiàn)的Volunteers,實(shí)在是不錯(cuò)的功能。
GTT的“公共翻譯記憶庫(kù)”(Global shared TM)讓全世界的翻譯使用同一個(gè)翻譯記憶,在譯者之間,你可以使用我的翻譯記憶,我可以利用你的。人人為我,我為人人,不得不說這是一個(gè)偉大的創(chuàng)舉。也許曾經(jīng)有許多人、許多公司有過這個(gè)想法,但是,真正實(shí)現(xiàn)的只有Google。
此外,在“翻譯搜索結(jié)果”(即TM)中,譯者還可以對(duì)別人的翻譯結(jié)果進(jìn)行評(píng)價(jià),這也有利于辨別翻譯記憶的質(zhì)量以及Global shared TM的不斷完善。
但是,在驚嘆Google的諸多創(chuàng)新之余,我們又不得不提出來這個(gè)online CAT的一些欠缺:
(1). 術(shù)語庫(kù)方面
A. 術(shù)語管理功能過于簡(jiǎn)單 GTT提供了術(shù)語庫(kù)的一些基本維護(hù)功能,如添加術(shù)語(Upload entries)和搜索術(shù)語(Search entries),但是這些功能畢竟過于簡(jiǎn)單。如譯者想對(duì)其中的一些術(shù)語進(jìn)行修改、或在翻譯界面下(即翻譯過程中)直接從原文和譯文中選定術(shù)語添加到術(shù)語庫(kù),GTT就無能為力了。
B. 術(shù)語無法直接填入到譯文 在翻譯界面中,Toolkit中的Glossary只有提示的作用,但是無法直接填入到譯文(至少我試了多次都沒有成功,無論是雙擊還是右鍵etc.),這一點(diǎn)非常不方便。
(2). 翻譯記憶方面
A. 保密性 剛才提到“公共翻譯記憶庫(kù)”確實(shí)是一個(gè)偉大的創(chuàng)舉,但是同時(shí)又涉及到保密問題。在實(shí)際翻譯項(xiàng)目中,有很大一部分客戶要求譯者或翻譯公司對(duì)其翻譯項(xiàng)目保密,簽署保密協(xié)議。這種項(xiàng)目的翻譯記憶是不能上網(wǎng)的。
B. 質(zhì)量 據(jù)我所知,Google買下了歐盟的翻譯記憶庫(kù),為這個(gè)“公共翻譯記憶庫(kù)”奠定了大好的基礎(chǔ)。但是,在將來,如果越來越多的人使用這個(gè)“公共翻譯記憶庫(kù)”,用戶中良莠不齊,如果沒有一支強(qiáng)大、合格、有責(zé)任心的譯審隊(duì)伍,GTT也無法保證翻譯記憶中的質(zhì)量。
(3). 文件大小限制
GTT的csv格式的術(shù)語對(duì)照文件不能大于1MB,待翻譯文件不能大于1MB,翻譯記憶交換文件(.tmx) 不能大于50MB。對(duì)于專業(yè)譯者而言,一個(gè)幾百M(fèi)B的TM,幾十MB的術(shù)語庫(kù),幾十MB的待譯件是完全可能的。特別是遇到大項(xiàng)目需要多人協(xié)同翻譯時(shí),GTT的文件大小限制會(huì)成為一個(gè)大問題。
這篇文章只是對(duì)谷歌輔助翻譯系統(tǒng) Google Translator Toolkit 的使用做一個(gè)簡(jiǎn)單的介紹,目的是讓更多的人了解這個(gè)工具,用起來這個(gè)工具,其中還有許多小功能沒有提及。歡迎大家到翻譯中國(guó)的論壇(http://www.fane.cn/forum.asp)中討論心得體會(huì)?偠灾,Google在在線CAT領(lǐng)域邁出了重要的一步,我們譯者對(duì)GTT這種免費(fèi)的好工具求之不得,愿GTT在將來多做出改進(jìn),真正切實(shí)地成為在線CAT的No. 1 !~
|
|
| |
|
|
|