Što je prijevodna memorija i kako funkcionira? Tehnologija memorije prijevoda. Primjena prijevodne memorije kroz predprijevod

💖 Sviđa li vam se? Podijelite vezu sa svojim prijateljima

(rjeđe - dio složene rečenice ili odlomak). Ako se jedinica prijevoda izvornog teksta točno podudara s jedinicom prijevoda pohranjenom u bazi podataka (točno podudaranje, engleski. točno podudaranje), može se automatski umetnuti u prijevod. Novi se segment također može malo razlikovati od onog pohranjenog u bazi podataka (nejasno podudaranje). nejasno podudaranje). Takav se segment također može umetnuti u prijevod, ali će prevoditelj morati napraviti potrebne izmjene.

Osim što ubrzavaju proces prevođenja fragmenata koji se ponavljaju i izmjena već prevedenih tekstova (primjerice, nove verzije softverskih proizvoda ili promjena zakonodavstva), PP sustavi također osiguravaju ujednačenost prijevoda terminologije u istim fragmentima, tj. posebno važno u tehničkom prevođenju. S druge strane, ako prevoditelj redovito zamjenjuje točna podudaranja izvučena iz prevoditeljskih baza podataka u svoj prijevod, bez praćenja njihove upotrebe u novom kontekstu, kvaliteta prevedenog teksta može se pogoršati.

U svakom specifičnom programskom sustavu podaci se pohranjuju u svoj vlastiti vlastiti format(format teksta u Wordfastu, baza podataka Pristup podacima u Deja Vu), ali postoji međunarodni standard TMX (eng. Translation Memory eXchange format ), koji se temelji na XML-u i koji mogu generirati gotovo svi softverski sustavi. Zahvaljujući tome, napravljeni prijevodi mogu se koristiti u različite primjene, odnosno prevoditelj koji radi s OmegaT-om može koristiti PP kreiran u TRADOS-u i obrnuto.

Većina softverskih sustava barem podržava stvaranje i korištenje korisničkih rječnika, stvaranje novih baza podataka temeljenih na paralelnim tekstovima (eng. poravnanje), kao i poluautomatsko izdvajanje terminologije iz izvornih i paralelnih tekstova.

Popularni PP softverski sustavi

Prema recenzijama korištenja PP sustava, najpopularniji sustavi uključuju:

Engleska Wikipedia ima popis koji uspoređuje mogućnosti različitih sustava.

Standardi i formati prijevodne memorije

  • TMX (Translation Memory Exchange Format - Razmjena prijevodne memorije) format. Ovaj standard omogućuje razmjenu između različitih pružatelja prijevodne memorije. TMX je uobičajeni format među prevoditeljima i najprikladniji je za uvoz i izvoz prijevodnih memorija. Najnovija verzija ovog formata - 1.4b omogućuje vraćanje izvornih dokumenata i njihov prijevod iz TMX datoteke.
  • TBX (Termbase Exchange format - Razmjena terminološke baze). Ovaj LISA (Localization Industry Association) format trenutno se revidira i ponovno izdaje u skladu s ISO 30042. Ovaj standard omogućuje razmjenu terminologije, uključujući detaljne leksičke informacije. Temeljna osnova TBX-a definirana je standardima: ISO 12620, ISO 12200 i ISO 16642. ISO 12620 pruža registar dobro definiranih "kategorija podataka" sa standardiziranim nazivima koji funkcioniraju kao tipovi podatkovnih elemenata ili unaprijed definirane vrijednosti. ISO 12200 (također poznat kao MARTIF) pruža osnovu za okvir TBX. ISO 16642 (također poznat kao Terminološki označni okvir) uključuje strukturni metamodel za Terminološke označne jezike općenito.
  • SRX je dizajniran za poboljšanje TMX formata i učinkovitiju razmjenu prijevodne memorije između programa. Mogućnost specificiranja pravila segmentacije koja su korištena u prethodnom prijevodu povećava učinkovitost identificiranja segmenata u trenutnom tekstu sa sadržajem PP-a.
  • GMX GILT je kratica za globalizaciju, internacionalizaciju, lokalizaciju i prijevod. Standard GILT Metrics sastoji se od tri dijela: GMX-V za metriku volumena, GMX-C za metriku složenosti i GMX-Q za metriku kvalitete. Predloženi GILT Metrics standard ima za cilj kvantificirati opseg posla i zahtjeve kvalitete prilikom provedbe GILT zadataka.
  • OLIF je otvoreni standard kompatibilan s XML-om koji se koristi za razmjenu terminologije i leksičkih podataka. Iako je izvorno korišten kao način razmjene leksičkih podataka između vlasničkih leksikona strojnog prevođenja, format se postupno razvio u općenitiji standard za razmjenu terminologije.
  • XLIFF (XML Localization Interchange File Format - XML ​​​​format za međusobnu razmjenu tijekom lokalizacije), kreiran kao jedan format datoteke za međusobnu razmjenu koji svi prepoznaju softver lokalizacija. XLIFF je najbolji način prevoditeljske industrije za razmjenu informacija u XML formatu.
  • TransWS (Translation Web Services) definira potrebne parametre za pozivanje web servisa prilikom slanja i primanja datoteka i poruka vezanih uz projekte lokalizacije. Zamišljen je kao sveobuhvatan sustav za automatizaciju procesa lokalizacije korištenjem usluga na Internetu.
  • xml:tm, ovaj pristup prijevodnoj memoriji temelji se na konceptu tekstualne memorije, koja vam omogućuje kombiniranje autorske memorije i prijevodne memorije. XML-INTL je Lisi OSCAR dao format xml:tm.

Prednosti i nedostatci

Prednosti

  • Smanjenje vremena i količine rada prevoditelja
  • Poboljšana dosljednost prijevoda, posebno kada grupa prevoditelja radi na istom projektu.
  • Povećanje profita povećanjem produktivnosti prevoditelja ili grupe prevoditelja
  • Poboljšanje kvalitete usluga povećanjem točnosti i ujednačenosti prijevoda pojmova, posebice u stručnim tekstovima.

Mane

  • Može učiniti prijevod "suhoparnijim"; gubi se sama bit teksta ako prijevod pomoću prijevodne memorije izvodi niskokvalificirani prevoditelj
  • Često ne postoji veza između rečenice/teksta koju nudi program i susjednih rečenica te teksta u cjelini.
  • Izvornik mora biti u elektroničkom obliku
  • Jedna neotkrivena greška može se proširiti kroz cijeli projekt
  • Potrebno je obučiti sam program, a pri promjeni posla - možda više puta (ako poslodavci rade s različitim programima TM)
  • Nije prikladno za sve vrste tekstova
  • Visoka cijena licenciranog softvera

vidi također

Književnost

  • Grabovsky V.N. Tehnologija memorije prijevoda // Mostovi. Časopis prevoditelja. 2004. br. 2. - str. 57-62.

Linkovi

  • Nemojte raditi isti prijevod dvaput // Computerra Online, 14. veljače 2005.

Bilješke


Zaklada Wikimedia. 2010.

Pogledajte što je "Prijevodna memorija" u drugim rječnicima:

    Sadržaj 1 U psihologiji 2 U računalna tehnologija... Wikipedia

    Mozaik koji prikazuje ... Wikipedia

    Tekst na jednom jeziku zajedno s njegovim prijevodom na drugi jezik. "Paralelno poravnanje teksta" je identifikacija podudarnih rečenica u obje polovice paralelnog teksta. Velike zbirke paralelnih tekstova nazivaju se... ... Wikipedia

    Paralelni tekst (bitext) tekst na jednom jeziku zajedno s njegovim prijevodom na drugi jezik. "Paralelno poravnanje teksta" je identifikacija podudarnih rečenica u obje polovice paralelnog teksta. Veliki sastanci... ... Wikipedia

    Prijevodna memorija (TM, ponekad nazvana "Prijevodna memorija") je baza podataka koja sadrži skup prethodno prevedenih tekstova. Jedan unos u takvoj bazi podataka odgovara segmentu ili “jedinici prijevoda” (engleski... ... Wikipedia

V.N. Grabovski; Časopis prevoditelja praktičara "MOSTOVI" 2/2004

U članku se govori o novom prevoditeljskom alatu - Translation Memory (TM) tehnologiji, zahvaljujući kojoj se provodi mehanizacija prevoditeljskih aktivnosti.

Neuronske mreže u radu prevoditelja

Teorije strojnog prevođenja, koje su sporo razvijane od pamtivijeka, dobile su veliki poticaj od 1970-ih. Tome je pridonio značajan napredak u području modeliranja intelektualne aktivnosti. Uz čisto znanstveni interes, to je objašnjeno rastućom ulogom međujezične komunikacije u suvremenom svijetu.

Uz elektroničke rječnike i razgovorne rječnike, do sredine 1990-ih, "elektronički prevoditelji" (počeli su se nazivati ​​MT tehnologija) postali su prilično rašireni. U principu, “elektronički prevoditelji” su programi koji mogu obraditi cijeli tekst. Istina, izlaz nije bio ono što je bilo potrebno, i iskreno, nije uopće bilo ono što je bilo potrebno. Da bi rezultat MT tehnologije postao doista koherentan tekst, čovjek je morao puno raditi na njemu.

Koncept “strojnog prevođenja” postao je dobro poznat. Domaći programi Stylus (sada se zove Promt I Sokrate). Međutim, interes za takve programe postupno je opadao nakon razdoblja početne znatiželje, a sada je nizak, iako su značajno poboljšani. Trenutno se uglavnom koriste za upoznavanje sa sadržajem stranica na stranom jeziku na internetu, kao i za čitanje i pisanje. elektronička pošta na stranom jeziku.

Uglavnom, posao prevoditelja nije se bitno promijenio kroz stoljeća. Da, pojavila su se računala, neka vrsta brzih i praktičnih pisaćih strojeva. Da, pojavili su se “elektronički prevoditelji”. Međutim, iako su se MT tehnologije poboljšale, nisu postale alat sa širokim rasponom primjena i uistinu štede vrijeme i trud.

Što je tehnologija Translation Memory

Tehnologija je postala novi alat za prevoditelje Translation_Memory(TM). Na Zapadu su TM tehnologija i prevoditeljski alati stvoreni na njezinoj osnovi - Translation Memory Tools (TMT) - dobro poznati i široko korišteni. Značajka ove tehnologije je mehanizacija prevoditeljskih aktivnosti, a ne njezina automatizacija u obliku u kojem su je vidjeli kreatori MT tehnologije. Štoviše, ovo na prvi pogled skromnije rješenje donijelo je nemjerljivo više praktičnih koristi od globalnog koncepta “elektroničkih prevoditelja”.

Razlika od elektroničkih rječnika i drugih prevoditeljskih alata je u tome što se tipični program klase TM temelji na neuronskim mrežama koje mogu do određene mjere simulirati rad ljudski mozak prilikom obrade podataka. Te su mreže sposobne učiti i analizirati složene skupove podataka koje je teško obraditi pomoću linearnih algoritama.

Ovi programi koriste neizraziti algoritam za traženje riječi ne samo u njihovim rječničkim oblicima, već iu drugim oblicima, na primjer, u drugom padežu. Osim toga, mogu pronaći fraze u drugom redoslijedu riječi. Samoorganizirajuća umjetna neuronska mreža sposobna je pronalaziti obrasce i utvrđivati ​​odnose među njima. Program uspoređuje komad na kojem trenutno radite sa sadržajem baze podataka i daje te informacije na zaslon. Može utvrditi da je dati fragment sličan sličnom fragmentu koji postoji u memoriji sustava, na primjer, 99%, 74%, ili čak 20%.

Svakom prevoditelju poznat je osjećaj da je sintagmu s kojom se trenutno muči već negdje, jednom davno, barem u približnom obliku susreo. Štoviše, naišao je ili u istom materijalu, ili u nekom drugom prevedenom ranije. To je samo neka vrsta déjà vu... Htio bih to pogledati, ovu frazu, barem za referencu, da smisleno formuliram ovu na kojoj sada radite...

Počneš prelistavati original, prekapati po polici s knjigama. I nerijetko se događalo da je traženi izraz doista pronađen. Najčešće kada je prekasno, nakon što je rad na prijevodu završen. Mislim da bih u takvom trenutku dao sve za alat koji bi mi pomogao pronaći potreban tekst. Čak i sada, kada tekst prijevoda tipkate na računalu, a ne na pisaćem stroju, uvijek je šteta ponavljati nešto što je tako teško sastavljeno. Dugogodišnji san prevoditelja je smisliti neki način koji bi ga oslobodio potrebe da više puta prevodi istu frazu.

Ovakva ideja je temelj stvaranja tehnologije Translation Memory, ili jednostavno TM, na temelju koje su se u kasnim 80-ima - ranim 90-ima počeli pojavljivati ​​više ili manje izvedivi programi. Zapravo, takav program je kontrolna ljuska koja radi s jednim ili drugim plug-in bazom podataka (TM) i koju bih nazvao bankom prijevoda. TM je kompjuterizirana verzija velikog ormara za arhiviranje u kojem se pohranjuje svaka fraza koju ste ikada preveli, u paru - i na izvornom i na ciljnom jeziku. Svaki takav par naziva se dvojezičnim. Program će vas odmah podsjetiti kako je ovaj izraz preveden prošli put. Pristup informacijama je lak i brz.

Pregled glavnih programa klase Translation Memory

Trenutačno na svjetskom tržištu postoji nekoliko softverskih proizvoda koji koriste TM tehnologiju. Međusobno se razlikuju, a ponekad i značajno. Međutim, svi oni dijele neke zajedničke stvari funkcionalnost.

Na primjer, obično imaju uređivač teksta s dva paralelna prozora. Jedan prozor namijenjen je izvornom tekstu, drugi prijevodu. Kada se izvorni fragment teksta prikaže u izvornom prozoru (to može biti rečenica, odlomak, jedna riječ), počinje traženje sličnog fragmenta u bazi podataka. Ako postoji točno isti fragment u memoriji, automatski se prikazuje u prozoru za prijevod. Ako nije pronađen potpuno isti fragment, ali je pronađeno nešto slično, tada se pronađeni fragment prikazuje u prozoru programa, s naznakom postotka podudaranja.

Prevoditelj uređuje tekst prijevoda koji je predložio program, usklađujući ga s izvornikom, šalje ga u memoriju baze podataka i nastavlja na sljedeći. Ako se ništa ne pronađe, prevoditelj prevodi ispočetka, upisujući tekst u prozor za prijevod. Nakon završetka rada na ovom fragmentu, prevoditelj ga šalje u memoriju baze podataka i nastavlja na sljedeći. Stoga se nadopunjavanje TM događa automatski kako posao napreduje. Čim dvojezičnost uđe u TM, ona postaje dostupna korisniku. Ako se program TM nalazi na mrežni pogon i drugi korisnici rade s njim, tada novi dvojezični odmah postaje dostupan drugim prevoditeljima. Nakon što se izvorni fragment i prijevodni fragment pošalju u bazu podataka, sljedeći se fragment prikazuje u izvornom prozoru.

Prvi program ove vrste, nazvan Translation Manager, razvio je IBM. IBM je u početku koristio Translation Manager za svoje potrebe - za lokalizaciju (prilagodbu na strani jezici) vlastiti softver. Translation Manager tada je tržištu ponuđen kao komercijalni proizvod te je neko vrijeme imao monopol na ovom području. Ovaj program je prilično jednostavan za korištenje, brz i pruža dobre mogućnosti za individualne korisničke postavke. Postoje zasebni prozori za svaku od tri glavne funkcije - Prijevod, Prijevodna memorija i Rječnik. Prozor Translation Memory prikazuje podudaranja pronađena u memoriji, ako ih ima, a prozor Rječnik prikazuje terminologiju iz rječnika koje je razvio IBM. Ovaj program također ima neke neugodnosti, na primjer, kompliciranu proceduru za pretraživanje pojedinačnih riječi u Translation Memory.

Drugi program - SDLX - za vlastite potrebe razvila je jedna engleska tvrtka SDL, bavi se lokalizacijom softvera. Svaki program uključen u komplet instalira se zasebno. SDL Edit je zapravo sam program pomoću kojeg se prevodi. Ima tri prozora koji prikazuju izvorni tekst, prijevod i prijevodnu memoriju. Treba imati na umu da se dokument koji treba prevesti ne može izravno uvesti u SDL Edit. Prvo se mora pretvoriti pomoću SDL Convert, što je definitivno neugodno.

Program Već viđeno je popularan među prevoditeljima u Europi zbog svoje fleksibilnosti i prilagodljivosti. Osim praktičnosti, Déjà Vu se od ostalih proizvoda razlikuje i po najboljem omjeru cijene i kvalitete. U usporedbi s prethodna dva programa, predmetni proizvod ima niz praktičnih značajki. Stručnjaci napominju da je ovaj program od samog početka razvijan u kontaktu sa svojim budućim korisnicima. Poznato je da su najnoviju verziju Déjà Vua testirali, posebice, ruski prevoditelji. Jedan od njih, Andrey Gerasimov, napisao je pozitivnu recenziju ovog programa u časopisu MultiLingual Computing & Technology

Program je dobro poznat u našoj zemlji i popularan u Europi. STAR Transit. Ideološki se potpuno razlikuje od ostalih proizvoda dotične klase. Već imate neku ideju o njima i znate da svi imaju središnju bazu podataka veliki kapacitet, zbirka prijevoda u kojoj se potrebni podaci nalaze odmah (ako ih ima, naravno). Kako bi rekao Bill Gates: "Informacija na dohvat ruke." Dakle, svi programi Translation Memory imaju kabinet elektroničkog kataloga, ali Transit nema. S njim je sve drugačije. Izvorni podaci i prijevod spremaju se u tekstualnom formatu kao datoteke, koje prevoditelj smješta u direktorije po vlastitom nahođenju. Prevoditelj tada jednostavno može reći programu koje direktorije, pa čak i koje datoteke treba. Transit zatim formira asocijativnu mrežu poveznica s kojima radi. Unatoč nekim prednostima, Transit se u Rusiji ne koristi široko. Naposljetku, Promt, službeni distributer Transita, prebacio se na distribuciju Tradosovog Translator's Workbench-a.

Ali Translator’s Workbench, ili jednostavno Trados, brzo je postao raširen u Rusiji, prvo među prevoditeljskim tvrtkama, a potom i među pojedinačnim prevoditeljima. To se vjerojatno može objasniti činjenicom da omogućuje rad bez napuštanja Worda, što je psihički ugodnije. Tko voli gledati tekst išaran svim vrstama kodova uglate zagrade? Translator’s Workbench (Trados) je u usporedbi s drugim programima prikladniji za običnog prevoditelja koji nije stručnjak za programiranje; razumljiviji je od ostalih programa ove vrste. Konkretno, kontrolni gumbi opremljeni su opisima alata. Budući da ste u poznatom i razumljivom Wordu, možete koristiti sve njegove alate (na primjer, autotekst).

Ovaj proizvod ima cijeli set korisni alati koji su u drugim programima prisutni samo u jednoj ili drugoj mjeri. Jedan od tih alata je Analise, koji vam omogućuje da unaprijed analizirate izvorni tekst i otkrijete postoje li (i u kojoj količini) potpuna i nepotpuna podudaranja. Vrijedno je spomenuti ovo zgodan alat, poput Placeables, koji omogućuje, na primjer, automatsku promjenu brojeva u tekstu ako sve ostalo u prevedenom fragmentu odgovara onome što se nalazi u banci prijevoda (TM). Vrlo povoljno automatska funkcija zamjena decimalnih točaka i/ili zareza u brojevima, vremenskim formatima, kraticama itd. na odgovarajuće parametre koje je odredio prevoditelj.

Velika većina ruskih prevoditelja koji koriste TM tehnologiju preferiraju Translator’s Workbench (Trados).

Što je zajedničko programima Translation Memory?

Sažimajući opis glavnih softverskih proizvoda klase Translation Memory, valja napomenuti da oni, u pravilu, imaju niz zajedničkih funkcionalnosti.

Miješanje - poravnanje

Ova vam funkcija omogućuje stvaranje banaka za prijenos (TM) iz postojeće datoteke. Od dvije datoteke - jedne s izvornim tekstom i druge s tekstom prijevoda - stvara se skup dvojezičnih. Nasuprot rečenici izvornog teksta gradi se njegov prijevod. I tako dalje za sve datoteke koje je prevoditelj sastavio u jednu kolekciju. Stupanj pogodnosti funkcije kombinacije različite programe razne.

Održavanje

Kako se dvojezični ljudi gomilaju u bazi podataka, njihov se broj može toliko povećati da sadržaj baze podataka može prijeći sve granice. Mogu se pojaviti neke netočnosti, pa čak i pogreške, osobito ako program koristi mnogo korisnika na mreži. Bit će potrebno nešto urediti ili pojasniti, ili čak jednostavno izbrisati. Iskreno radi, mora se reći da spomenuti alat za održavanje programa ne rješava u potpunosti ovaj problem - u praksi je još uvijek teško nositi se sa začepljenjem prevoditeljskih banaka.

Terminološki rječnik - Terminološki program

Svi programi koji se razmatraju imaju svoje terminološke rječnike, koji su u biti svima poznati elektronički rječnici. Terminološki rječnici mogu uvoziti datoteke u obliku rječnika ili pojmovnika; također se mogu ažurirati ručno.

Uređivač teksta - Uređivač dokumenata

Ovdje se zapravo odvija proces prevođenja. U tu svrhu svi programi imaju dva gore navedena prozora - za izvorni tekst i za njegov prijevod. Svi uređivači teksta imaju mogućnost postavljanja postotka stupnja sličnosti onoga na što se prevodi ovaj trenutak izvorni tekst i tekst u knjižnici prijevoda. Što veći postavite postotak sličnosti, kao što je 90% ili 95%, manja je vjerojatnost da ćete tamo pronaći odgovarajući tekst. Međutim, možete postaviti manji postotak, tada možete nakupiti puno materijala koji bi bio koristan barem za referencu.

Konkordancija (Povezivanje upotrebe riječi s kontekstom) - Konkordancija

Ovo je vrlo korisna značajka svih programa koji se razmatraju. Često se događa da pojam (ili kombinacija pojmova) može imati više značenja ili nijansi značenja. Odabirom pojma u prozoru možete vidjeti sve dvojezične u zbirci i to u različitim kontekstima. To uvijek olakšava odabir najtočnijeg prijevoda određenog pojma ili kombinacije.

Natalya Shakhova, direktorica agencije EnRus, smatra da većina TM proizvoda oslobađa korisnika potrebe da se upozna s različitim programima za obradu teksta. Dovoljno je proučiti karakteristike uređivač teksta sam proizvod, te ćete moći kontrolirati svu raznolikost tekstova, bilo da su predstavljeni u QuarkXPress, FrameMaker ili Adobe Illustrator. Postoji, naravno, neka kvaka: kako bi svladali sljedeći program za obradu teksta ili izdavački sustav, trebat će vam odgovarajući program za filtriranje koji - što? Tako je - prodaje se za nešto novca! Općenito, pitanje novca je najozbiljnije kada je u pitanju TMT. Nisu jeftini (obično nekoliko stotina dolara) i, naravno, nema kompatibilnosti. Stoga, ako ste kupili (i svladali!) proizvod za jedan projekt, tada ćete za sljedeći možda morati kupiti drugi proizvod i potrošiti vrijeme na ponovno učenje.

Natalia Shakhova nadalje primjećuje da Zapad već aktivno raspravlja o posljedicama širokog širenja takvih programa. Jedna od njih je da novi prevoditelj gubi mogućnost ulaska na tržište. Kao što je u Rusiji ionako vrlo teško prevoditelj dobiti narudžbu ako nema računalo i printer, tako u inozemstvu postoje problemi sa zapošljavanjem prevoditelja koji nemaju TM program. Ova pojava ima i pozitivnu stranu - angažiranjem vlasnika TM programa kupac dobiva određeno jamstvo njegove profesionalnosti. Ali čak i početnici trebaju imati priliku započeti!

Stavovi prema tehnologiji Translation Memory kod nas su različiti.

Kada je prevoditeljska agencija Phonetics 1999. počela raditi s Trados Translator’s Workbenchom, naravno, tijekom kontakta s kupcima razgovarali smo o prelasku na nova tehnologija. Suprotno očekivanjima, reakcija je bila oprezna, a ponekad i potpuno negativna. Pokazalo se da je ideja o strojnom prevođenju već bila ugrožena nepromišljenim korištenjem programa poput Stylusa i Socrata u 90-ima. Štoviše, često su ih koristili prevoditelji, recimo, ne baš visokokvalificirani, koji se nisu zamarali uređivanjem onoga što su proizveli “elektronički prevoditelji”. No, mogu se razumjeti i korisnici ovih programa – uređivanje ovih tekstova zahtijevalo je mnogo vremena i truda.

Čak i sada, ponekad možete pronaći klijente iz ruskih organizacija koji pokazuju oprezan stav prema bilo kakvim inovacijama u području softvera za prevođenje. U isto vrijeme, strane tvrtke, naprotiv, zahtijevaju korištenje programa klase Translation Memory. Često imaju utvrđene postavke, uglavnom Trados Translator’s Workbench, kao i Star Transit. Često imaju gotove TM-ove (banke prijevoda) koje nude na korištenje.

Što se tiče prevoditelja, oni imaju razumljivo zanimanje za tehnologiju Translation Memory. Prevoditeljske agencije još su razumljivije zainteresirane za njih. Oni se ne bave toliko fikcijom, novinarstvom, poezijom itd., koliko uputama za rad, vodičima za rješavanje problema i lokalizacijom softvera, tj. s onim materijalima u kojima se ponavljaju ili slični fragmenti teksta.

Čini se da su u svom sadašnjem obliku programi Translation Memory dosegli gornju granicu. Daljnji rad na njihovoj doradi ide putem poboljšanja njihove postojeće funkcionalnosti. To dovodi do činjenice da programi postaju sve glomazniji i složeniji, i to unatoč činjenici da nema fundamentalno novih ideja. Isti Translator’s Workbench (Trados) u svom Najnovija verzija stekao takav skup alata koji jednostavnom korisniku vrlo ih je teško razumjeti.

Rad ovog programa zahtijeva prisutnost zasebnog zaposlenika u osoblju prevoditeljske agencije. Osim korisničkog priručnika, dokumentacija uključuje Stručni vodič za TRADOS. Dodatno, paket dokumentacije uključuje Vodič za upravljanje projektima, MultiTerm korisnički priručnik i WinAlign korisnički priručnik. Čak će i obučeni prevoditelj zahtijevati mnogo truda i vremena da pregleda stotine stranica ovih dokumenata.

Grupa istraživača sa Sveučilišta Maryland, okrug Baltimore (SAD), pod vodstvom profesora S. Nirenburga, poznatog stručnjaka u području umjetne inteligencije i strojnog prevođenja, traži nova rješenja. Dosadašnji razvoj je u fazi teorijskog istraživanja, a dovođenje ovog istraživanja u fazu komercijalnog proizvoda najvjerojatnije će zahtijevati dosta vremena.

Važno je napomenuti da tržište prevoditeljskih alata uglavnom zauzimaju strane tvrtke. Želio bih se nadati da ovo neće potrajati zauvijek. Potencijal za teorijski razvoj ruskih stručnjaka u području semantičke analize vrlo je velik. Naša su istraživanja u ovom području dosegla vrlo visoku razinu. Postoje svi razlozi za očekivati ​​da će se ti razvoji materijalizirati u obliku temeljno novih lingvističkih tehnologija koje će u potpunosti osloboditi kreativni potencijal prevoditelja.

Časopis prevoditelja u praksi"Mostovi", jedan od rijetkih stručnih časopisa za prevoditelje. Časopis objavljuje članke prevoditelja različitih specijalnosti, usmene i pisane. Na stranicama časopisa imaju priliku razgovarati prevoditelji specijalizirani za različita područja znanja stvarne probleme, raspravljati jedni s drugima, dijeliti tajne profesionalne izvrsnosti.

Prijevodna memorija

Prijevodna memorija (TM, ponekad nazvana "Prijevodna memorija") je baza podataka koja sadrži skup prethodno prevedenih tekstova. Jedan unos u takvoj bazi podataka odgovara "prijevodnoj jedinici", koja se obično uzima kao jedna rečenica (rjeđe, dio složene rečenice ili odlomak). Ako sljedeća rečenica izvornog teksta točno odgovara rečenici pohranjenoj u bazi podataka (točno podudaranje), može se automatski zamijeniti u prijevodu. Nova ponuda se također može malo razlikovati od one pohranjene u bazi podataka (nejasno podudaranje). Takva se rečenica također može umetnuti u prijevod, ali će prevoditelj morati napraviti potrebne izmjene.

Osim što ubrzavaju proces prevođenja fragmenata koji se ponavljaju i izmjena već prevedenih tekstova (primjerice, nove verzije softverskih proizvoda ili promjena u zakonodavstvu), sustavi Translation Memory također osiguravaju ujednačenost prijevoda terminologije u istim fragmentima, što posebno je važno u tehničkom prevođenju. S druge strane, ako prevoditelj redovito zamjenjuje točna podudaranja izvučena iz prevoditeljskih baza podataka u svoj prijevod, bez praćenja njihove upotrebe u novom kontekstu, kvaliteta prevedenog teksta može se pogoršati.

Svaki specifični sustav Translation Memory pohranjuje podatke u vlastitom formatu (tekstualni format u Wordfastu, Access baza podataka u Deja Vu), ali postoji međunarodni standard TMX (Translation Memory eXchange format), koji se temelji na XML-u i koji se može generirati gotovo svi PP sustavi. Zahvaljujući tome, rezultati rada prevoditelja mogu se razmjenjivati ​​između aplikacija, odnosno prevoditelj koji radi s OmegaT-om može koristiti prijevodnu memoriju kreiranu u TRADOS-u i obrnuto.

Većina sustava Translation Memory minimalno podržava stvaranje i korištenje korisničkih rječnika, stvaranje novih baza podataka temeljenih na paralelnim tekstovima (englesko poravnanje), kao i poluautomatsko izdvajanje terminologije iz izvornih i paralelnih tekstova.

Popis softverskih sustava prijevodne memorije

Prema nedavnim pregledima korištenja sustava prijevodna memorija Najpopularniji sustavi uključuju.

TM je baza podataka u kojoj se pohranjuju završeni prijevodi. TM tehnologija radi na principu akumulacije: u procesu prevođenja u TM spremaju se izvorni segment (rečenica) i njezin prijevod. Prilikom obrade novog teksta primljenog na prijevod, sustav uspoređuje svaku rečenicu sa segmentima pohranjenim u bazi podataka. Ako se pronađe segment identičan ili sličan izvorniku, prikazuje se prijevod tog segmenta zajedno s prijevodom i pokazateljem postotka podudaranja. Riječi i izrazi koji se razlikuju od spremljenog teksta su istaknuti. Dakle, prevoditelj samo mora prevesti nove segmente i urediti one koji se djelomično podudaraju. Svaka promjena ili novi prijevod sprema se u TM. Kao rezultat toga, nema potrebe dvaput prevoditi istu rečenicu.

S druge strane, pri radu sa velike projekte Prevoditelj se suočava s problemom dosljedne primjene terminološkog pojmovnika tijekom dugog projekta ili brzog ponovnog korištenja prethodno prevedenog teksta. Slične naravi rutinski poslovi relativno je lako (za razliku od strojnog prevođenja) formalizirati i programirati.

Svaki zapis baze podataka TM predstavlja jedinicu (rečenicu ili odlomak) paralelnih tekstova (obično na dva jezika). Takva baza podataka pohranjuje prethodne prijevode u svrhu njihove moguće ponovne upotrebe i rješavanja problema brzog pretraživanja sadržaja. Unatoč činjenici da se programi opremljeni prijevodnom memorijom nazivaju računalno potpomognuti sustavi prevođenja (CAT), ne treba ih brkati s programima za strojno prevođenje - prijevodna memorija ništa ne prevodi sama, dok se strojno prevođenje temelji na generiranju prijevodi na temelju rezultata gramatičke analize izvornog teksta.

Zapis prijevodne memorije u pravilu se sastoji od dva segmenta: na izvornom (izvornom) i ciljnom (ciljnom) jeziku. Ako se u tekstu pojavi identičan (ili sličan) segment na izvornom jeziku, segment na ciljnom jeziku bit će pronađen u prijevodnoj memoriji i ponuđen prevoditelju kao temelj za novi prijevod. Automatski pronađeni tekst može se koristiti kakav jest, uređivati ​​ili potpuno odbaciti. Većina programa koristi algoritam neizrazitog podudaranja, što značajno poboljšava njihovu funkcionalnost, budući da je u ovom slučaju moguće pronaći rečenice koje samo nejasno podsjećaju na fraze za pretraživanje, ali su ipak prikladne za naknadno uređivanje.

Prednosti korištenja takvog softvera u početku možda neće biti očite - međutim, kako se baza podataka bude punila, rezultati automatske zamjene prijevodnih baza postat će točniji i pravilniji.

Arhitektura automatiziranog sustava i njegova funkcionalnost mogu varirati. Alati za pretraživanje mogu raditi s cijelim segmentima ili s pojedinačnim riječima ili izrazima, omogućujući prevoditelju da izvrši terminološka pretraživanja. Sustav također uključuje zaseban program raditi s pojmovnikom koji sadrži termine odobrene za korištenje u projektu. Neki sustavi rade s programima za strojno prevođenje. Glavno operativno sučelje ili se izravno integrira u postojeći program za obradu teksta, kao što je Word, ili je zasebni uređivač. Sustav nužno uključuje filtre za uvoz i izvoz datoteka različitih formata. Osim toga, mnogi, ako ne i svi, sustavi imaju mogućnost dodavanja segmenata iz prevoditeljevih starih prevedenih datoteka u prijevodnu memoriju.

Ono što se odnosi na koncept učenja jezika također se odnosi i na Translation Memories.

“Prazni” sustav pamti pojmove i rečenice.

Izgrađena je "prijevodna memorija" - Translation Memory (TM).

TM postaje "jezična memorija" za proizvod ili za aktivnosti tvrtke u cjelini.

TM sustavi: SDLX, TRADOS, Deja Vu, Star Transit, Trans Suite 2000, WordFast, WordFisher, ACROSS.

KOMBINIRANI SUSTAVI

MP i TM tehnologije se nadopunjuju, ali se ne dupliciraju. MP sustav je spreman za korištenje odmah nakon instalacije (iako to ne isključuje mogućnost da će tijekom rada korisnik htjeti nešto promijeniti u rječniku, algoritmima prijevoda itd.). TM sustav mora biti posebno konfiguriran za prevođenje tekstova u određenom području, a što su ti tekstovi sličniji jedni drugima (npr. takav sustav se koristi za prijevod standardnih ugovora), to je manje vremena potrebno za konfiguraciju.

S tim u vezi, potpuno je logična pojava hibrida - programi za strojno prevođenje temeljeni na primjerima - koji kombiniraju strojno prevođenje i TM sustave (npr. tvrtka PROMT je kreirala integriranu tehnologiju PROMT Term i PROMT For TRADOS, koja objedinjuje TM TRADOS sustav i sustav za strojno prevođenje - PROMT XT Professional). PROMT For TRADOS (P4T) dizajniran je za integraciju PROMT sustava za strojno prevođenje i TM TRADOS sustava:

Prijevod u sustavu TRADOS;

Prijevod u sustavu PROMT segmenata koji se ne nalaze u TM-u;

Umetanje prevedenih PROMT segmenata u TM.

Shema automatiziranog prijenosnog lanca temeljena na integriranoj PROMT-TRADOS tehnologiji

Korištenje integrirane tehnologije čini proces prevođenja velikih količina dokumentacije upravljivim i povećava njegovu ekonomsku učinkovitost.

Primjer implementacije projekta korištenjem integrirane PROMT-TRADOS tehnologije.

Pretpostavimo da trebate prevesti upute za mini-PBX.

1. U prvoj fazi koristi se program PROMT TerM. Dokumenti se analiziraju i identificira osnovna terminologija koja se unosi u rječnike PROMT sustava za strojno prevođenje.

2. Strojno prevođenje (MT) izvodi se s povezanim rječnikom, nastavlja se terminološki rad na ispravljanju rječnika.

3. Rezultati procesa prevođenja ispravljaju se i unose u TM prevedenog dokumenta.

4. Na taj način korisnik dobiva:

Terminološki rječnik;

Prevedeni dokument;

TM koji odgovara prevedenom dokumentu, a koji se može koristiti u daljnjem radu s dokumentima ove vrste.

Sustavi za automatsko projektiranje

CAD je softver namijenjen izradi crteža, projektne i tehnološke dokumentacije, kao i 3D modela. U ovaj popis Uključeni su najčešći CAx programi (CAD, CAM, CAE).

Kada govorimo o automatiziranom prevođenju, obično mislimo na programe koji provode prijevod temeljen na tehnologiji strojnog prevođenja (Machine Translation). Međutim, postoji još jedna tehnologija - Translation Memory, koja, iako nije toliko poznata ruskim korisnicima, ipak ima niz prednosti.

Brzi razvoj tehnološkog napretka doveo je do povećanja broja tehnički uređaji, automobile i drugu složenu opremu bez koje je život suvremenog čovjeka gotovo nezamisliv. Primjerice, obim dokumentacije za europski zrakoplov Airbus iznosi desetke tisuća stranica. Kako pokazuju podaci istraživanja koje je krajem 2004. godine provela udruga LISA (LISA 2004 Translation Memory Survey), 42% ispitanika godišnje prevede oko milijun riječi, 24% tvrtki koje sudjeluju u istraživanju ima godišnju količinu prijevoda. od 1-5 milijuna, 12 % prevodi od 5 do 10 milijuna, obujam prijevoda drugih tvrtki je od 10 do 500 ili više milijuna riječi godišnje. Konkretno, većina današnjih proizvođača nije ograničena na svoje lokalno tržište i aktivno razvija regionalna tržišta. Istovremeno, lokalizacija proizvoda, uključujući i prijevod opisa proizvoda na lokalni jezik, jedan je od preduvjeta za ulazak na novo tržište.

U isto vrijeme, iako proizvođači redovito izdaju nove verzije svojih proizvoda - automobila, bagera, računala i Mobiteli, softver - nisu svi bitno drugačiji od prethodnih modela. Ponekad je novi model telefona malo izmijenjen (ili restiliziran) prethodni model. Nove verzije se bolje prodaju, pa proizvođači moraju redovito ažurirati svoje proizvode. Kao rezultat toga, dokumentacija za svaki od ovih proizvoda često je 70-90% identična onoj prethodne verzije.

Dva su čimbenika - velika količina dokumenata koji zahtijevaju prijevod i njihovo često ponavljanje - poslužila kao poticaj za stvaranje tehnologije Translation Memory (skraćeno TM, ne postoji općeprihvaćen ruski prijevod ovog izraza). Bit TM tehnologije može se figurativno prenijeti u jednoj rečenici: "Ne prevodite isti tekst dvaput." Drugim riječima, Translation Memory koristi se za ponovno korištenje prethodno napravljenih prijevoda. To vam omogućuje značajno smanjenje vremena potrebnog za pripremu prijevoda, posebno kada radite s tekstovima koji imaju visok stupanj ponavljanja.

Tehnologija Translation Memory često se miješa sa strojnim prevođenjem, koje je svakako također korisno i zanimljivo, ali njegov opis nije svrha ovog članka. Korištenje TM tehnologije povećava brzinu prevođenja smanjenjem količine mehaničkog rada. No, važno je napomenuti da TM ne obavlja prijevod za prevoditelja, već je moćan alat za smanjenje troškova kod prevođenja tekstova koji se ponavljaju.

TM tehnologija radi na principu akumuliranja rezultata prijevoda: tijekom procesa prevođenja, izvorni tekst i njegov prijevod pohranjuju se u TM bazu podataka. Kako bi se olakšala obrada informacija i usporedba različitih dokumenata, sustav Translation Memory rastavlja sav tekst u zasebne dijelove koji se nazivaju segmenti. Ti segmenti su najčešće rečenice, ali mogu se usvojiti i druga pravila segmentacije. Prilikom učitavanja novog teksta, TM sustav vrši segmentaciju i uspoređuje segmente izvornog teksta s onima koji su već dostupni u povezanoj bazi prijevoda. Ako sustav uspije pronaći segment koji u potpunosti ili djelomično odgovara, prikazuje se njegov prijevod koji pokazuje podudaranje u postotku. Segmenti koji se razlikuju od spremljenog teksta su istaknuti. Dakle, prevoditelj može prevoditi samo nove segmente i uređivati ​​one koji se djelomično podudaraju.

U pravilu, prag podudaranja postavljen je na razini koja nije niža od 75%, jer ako postavite niži postotak podudaranja, troškovi uređivanja teksta će se povećati. Svaka promjena ili novi prijevod sprema se u TM, tako da nema potrebe dvaput prevoditi istu stvar!

Također je važno stalno nadopunjavati bazu podataka Translation Memory pohranjivanjem u bazu (ili u baze podataka, ako se prevodi na različite teme) parova segmenata "izvorni tekst - točan prijevod". To će znatno smanjiti vrijeme potrebno za prevođenje sličnih tekstova. Osim što smanjuje intenzitet rada prevođenja, sustav TM omogućuje održavanje jedinstva terminologije i stila u cijeloj dokumentaciji.

Korištenje TM tehnologije daje prevoditelju sljedeće prednosti:

  • povećanje produktivnosti rada. Zamjena čak 80% podudarnih segmenata iz baze prijevoda može smanjiti vrijeme utrošeno na prijevod za 50-60%. Kao što praksa pokazuje, mnogo je učinkovitije urediti dovršeni prijevod nego ga ponovno prevesti - "ispočetka";
  • jedinstvo terminologije i stila u prisutnosti baze podataka prijevoda o predmetu dokumenta koji se prevodi. Ovo je osobito važno kod prevođenja visokospecijalizirane dokumentacije;
  • organiziranje rada tima prevoditelja uz zajamčenu kvalitetu prijevoda zahvaljujući pristupu zajedničkoj bazi podataka Translation Memory.

Zasebno napominjemo da se u zapadnim zemljama, gdje je tehnologija Translation Memory odavno postala de facto obavezan alat za prevoditelje, sredstva utrošena na stvaranje prevoditeljske baze podataka ne smatraju troškovima, već ulaganjima u stabilan i kvalitetan rad, što poskupljuje samo profit, ali i vrijednost same tvrtke.

Tržište sustava Translation Memory

Neosporni lider na tržištu sustava Translation Memory je program SDL-TRADOS. U ljeto 2005. spojila su se dva najveća razvijača TM sustava - tvrtke SDL i TRADOS (softverski proizvodi pod markom TRADOS dobro su poznati mnogim korisnicima), a sada izdaju zajednički proizvod koji postavlja standarde u području Translation Memory.

Novi SDL-TRADOS sustav ima proširenu (korisnički podesivu) funkcionalnost neizrazitog podudaranja (traženje podudaranja u bazi prijevoda), kao i alate za provjeru kvalitete prevedenih dokumenata. Program provjerava pravopis i štiti sadržaj memorijskih blokova pomoću tehnologije šifriranja.

Sustav podržava formate kao što su Word DOC i RTF, online pomoć RTF, PowerPoint, FrameMaker, FrameMaker +SGML, FrameBuilder, Interleaf, QuickSilver, Ventura, QuarkXPress, PageMaker, SGML/HTML/XML, uključujući HTML pomoć, RC (Windows resurs) , Bookmaster (DCF) i Troff. Osim SDL-TRADOS sustava, na IT tržištu postoje i drugi TM sustavi. Posebno su dobro zastupljeni francuski proizvođači.

Sustav francuske tvrtke Atril (www.atril.com) tzv. Njegovi programeri najprije su organizirali vlastitu prevoditeljsku agenciju tehnička dokumentacija, nakon čega se javila ideja o izradi specijaliziranog softvera temeljenog na tehnologiji Translation Memory.

Ovo je samostalna aplikacija sa sistematiziranim izbornikom. Sustav može kreirati TM baze podataka, kao i terminološke baze podataka i povezati rječnike. Proces prevođenja provodi se u posebnoj ljusci projekta, gdje se prilikom izrade prilaže i povezuje datoteka koju je potrebno prevesti dodatne postavke: TM baza podataka, rječnici itd. Tekst se prevodi u posebnoj tablici, gdje nasuprot svakog stupca njegovog izvornika treba ispuniti opciju prijevoda. Prednosti također uključuju dodatna funkcija za prevođenje datoteka različitih formata, što vam omogućuje da sačuvate izvorno oblikovanje datoteke.



reci prijateljima
Pročitajte također