Що таке пам'ять перекладів, як вона працює. Технологія Translation Memory. Застосування пам'яті перекладів через попередній переклад

💖 Подобається?Поділися з друзями посиланням

(рідше - частина складносурядного речення, або абзац). Якщо одиниця перекладу вихідного тексту точно збігається з одиницею перекладу, що зберігається в базі (точна відповідність, англ. exact match), вона може бути автоматично підставлена ​​в переклад. Новий сегмент може також трохи відрізнятися від того, що зберігається в базі (нечітка відповідність, англ. fuzzy match). Такий сегмент може бути підставлений у переклад, але перекладач буде повинен внести необхідні зміни.

Крім прискорення процесу перекладу повторюваних фрагментів та змін, внесених до вже перекладених текстів (наприклад, нових версій програмних продуктів чи змін у законодавстві), системи ПП також забезпечують однаковість перекладу термінології в однакових фрагментах, що особливо важливо при технічному перекладі. З іншого боку, якщо перекладач регулярно підставляє у свій переклад точні відповідності, вилучені з баз перекладів, без контролю їх використання у новому контексті, якість перекладеного тексту може погіршитися.

У кожній конкретній системі ПП дані зберігаються у своєму власному форматі(текстовий формат у Wordfast, база даних Accessу Deja Vu), але існує міжнародний стандарт TMX (англ. Translation Memory eXchange format ), який заснований на XML і може генеруватися практично всіма системами ПП. Завдяки цьому зроблені переклади можна використовувати в різних додатках, тобто перекладач, що працює з OmegaT, може використовувати ПП, створену в ТРАДОС і навпаки.

Більшість систем ПП як мінімум підтримує створення та використання словників користувача, створення нових баз даних на основі паралельних текстів (англ. alignment), а також напівавтоматичне вилучення термінології з оригінальних та паралельних текстів.

Популярні програмні системи ПП

Відповідно до оглядів використання систем ПП до найбільш популярних систем належать:

В англійській Вікіпедії є список, що порівнює можливості різних систем.

Стандарти та формати пам'яті перекладів

  • TMX (Translation Memory Exchange Format – Обмін пам'яттю перекладів) формат. Цей стандарт забезпечує взаємний обмін між постачальниками пам'яті перекладів. TMX є загальноприйнятим форматом серед перекладачів і найкраще підходить для імпорту та експорту пам'яті перекладів. Остання версія цього формату – 1.4b дозволяє відновлювати вихідні документи та їх переклад із файлу TMX.
  • TBX (Termbase Exchange format – обмін термінологічними базами). Цей прийнятий LISA (Асоціації індустрії локалізації) формат зараз переглядається та перевидається згідно з ISO 30042. Цей стандарт дозволяє проводити обмін термінологією, у тому числі детальною лексичною інформацією. Основна база TBX визначається стандартами: ISO 12620, ISO 12200 та ISO 16642. ISO 12620 забезпечує реєстр чітко визначених "категорій даних" зі стандартизованими іменами, які функціонують як типи елементів даних або визначені значення. ISO 12200 (відомий також MARTIF) надає основу для каркасної структури TBX. ISO 16642 (відомий також як Terminological Markup Framework - Структура термінологічної розмітки) включає структурну метамодель для термінологічних мов розмітки (Terminology Markup Languages) загалом.
  • SRX створений для покращення формату TMX та більшої ефективності обміну пам'яттю перекладів між програмами. Можливість вказувати правила сегментації, які використовувалися в попередньому перекладі, підвищує ефективність ототожнення сегментів у поточному тексті з вмістом ПП.
  • GMX GILT означає Globalization, Internationalization, Localization, and Translation (Глобалізація, інтернаціоналізація, локалізація, переклад). Стандарт GILT Metrics складається із трьох частин: GMX-V для показників обсягу, GMX-C для показників складності, GMX-Q для показників якості. Запропонований стандарт GILT Metrics спрямований на квантифікацію обсягу робіт та вимог якості під час реалізації завдань GILT.
  • OLIF - відкритий стандарт, сумісний з XML, який використовується для обміну термінологічними та лексичними даними. Хоча спочатку він застосовувався як спосіб обміну лексичними даними між приватними лексиконами машинного перекладу, поступово цей формат перетворився на загальніший стандарт термінологічного обміну.
  • XLIFF (XML Localisation Interchange File Format - XML ​​формат для взаємного обміну під час локалізації), створений як єдиний формат файлів для взаємного обміну, який розпізнається всіма програмними засобамилокалізації. XLIFF - це найкращий у сучасній індустрії перекладів спосіб обміну інформацією форматі XML.
  • TransWS (Translation Web Services - перекладацькі веб-сервіси), визначає необхідні параметри виклику веб-сервісів при надсиланні та отриманні файлів та повідомлень, що стосуються проектів локалізації. Замислювався як розгорнута система автоматизації процесу локалізації з використанням сервісів у мережі Інтернет.
  • xml:tm, цей підхід до пам'яті перекладів ґрунтується на концепції текстової пам'яті, яка дозволяє поєднувати авторську пам'ять та пам'ять перекладів. Формат xml:tm було передано Lisa OSCAR компанією XML-INTL.

Переваги і недоліки

Переваги

  • Скорочення часу та обсягу роботи перекладача
  • Поліпшення послідовності перекладу, особливо під час роботи групи перекладачів над одним проектом.
  • Збільшення прибутку за рахунок збільшення продуктивності праці перекладача, групи перекладачів
  • Підвищення якості послуг за рахунок збільшення точності та однаковості перекладу термінів, особливо у спеціалізованих текстах.

Недоліки

  • Може робити переклад «сухішим»; втрачається сама суть тексту, якщо переклад із використанням накопичувача перекладів виконується перекладачем низької кваліфікації
  • Часто відсутній зв'язок запропонованої програмою пропозиції/тексту з сусідніми пропозиціями та з текстом загалом
  • Оригінал має бути в електронному вигляді
  • Одна непомічена помилка може поширитись на весь проект
  • Необхідно навчання самої програми, а при зміні роботи – можливо, і не один раз (якщо роботодавці працюють із різними програмами ТМ)
  • Підходить не до всіх видів текстів
  • Висока вартість ліцензійного ПЗ

Див. також

Література

  • Грабовський В. Н. Технологія Translation Memory // Мости. Журнал перекладачів. 2004. № 2. – С. 57-62.

Посилання

  • Не робіть той самий переклад двічі // Комп'ютерра Онлайн, 14 лютого 2005 року.

Примітки


Wikimedia Foundation. 2010 .

Дивитись що таке "Пам'ять перекладів" в інших словниках:

    Зміст 1 В психології 2 комп'ютерної техніки… Вікіпедія

    Мозаїка з … Вікіпедія

    Текст однією мовою разом з перекладом на іншу мову. "Вирівнювання паралельного тексту" це ідентифікація відповідних один одному пропозицій в обох половинах паралельного тексту. Великі збори паралельних текстів називаються ... Вікіпедія

    Паралельний текст (бітекст) текст однією мовою разом з перекладом на іншу мову. "Вирівнювання паралельного тексту" це ідентифікація відповідних один одному пропозицій в обох половинах паралельного тексту. Великі збори… … Вікіпедія

    Пам'ять перекладів (ПП, англ. translation memory, TM іноді звана "Накопичувач перекладів") - база даних, що містить набір раніше перекладених текстів. Один запис у такій базі даних відповідає сегменту або «одиниці перекладу» (англ. …

В.М. Грабовський; Журнал практикуючого перекладача "МОСТИ" 2/2004

Стаття розповідає про новий інструмент перекладача – технологію Translation Memory (TM), завдяки якій здійснюється механізація перекладацької діяльності.

Нейронні мережі у роботі перекладача

Теорії машинного перекладу, що розроблялися в млявому режимі з давніх-давен, з 1970-х років отримали серйозний імпульс. Це було з істотними досягненнями у сфері моделювання інтелектуальної діяльності. Крім суто наукового інтересу, це пояснювалося зростаючою роллю міжмовних комунікацій у світі.

Крім електронних словників та словників-розмовників, до середини 1990-х років досить велике поширення набули "електронні перекладачі" (їх стали називати технологією MT). В принципі, "електронні перекладачі" – це програми, які могли опрацювати цілий текст. Щоправда, на виході виходило не зовсім те, що треба, а якщо відверто, то зовсім не те. Щоб результат роботи технології MT став справді зв'язним текстом, людині доводилося чимало попрацювати з нього.

Поняття "машинний переклад" стало загальновідомим. Досить велике поширення у нас набули вітчизняні програми Stylus (зараз вона називається Promtі Сократ). Втім, інтерес до таких програм після періоду початкової цікавості поступово знижувався, і зараз він невеликий, навіть незважаючи на те, що їх значною мірою допрацювали. В даний час їх використовують в основному для знайомства зі змістом іншомовних сайтів в Інтернеті, а також для читання та написання електронних листівіноземною мовою.

За великим рахунком робота перекладача за століття принципово не змінилася. Так, з'явилися комп'ютери, такі швидкодіючі і зручні друкарські машинки. Так, з'явилися "електронні перекладачі". Однак при тому, що технології MT вдосконалювалися, вони так і не стали інструментом, що має широку сферу застосування і дозволяє по-справжньому економити час і сили.

Що таке технологія Translation Memory

Новим інструментом перекладача стала технологія Translation_Memory(ТМ). На Заході технологія TM та створений на її базі інструментарій перекладача – Translation Memory Tools (TMT) – добре відомі та широко застосовуються. Особливістю такої технології є механізація перекладацької діяльності, а не її автоматизація у тому вигляді, як її бачили творці технології MT. Причому це скромніше, на перший погляд, рішення принесло практичної користі незмірно більше, ніж глобальний задум "електронних перекладачів".

Відмінність від електронних словників та інших інструментів перекладача полягає в тому, що типова програма класу ТМ заснована на нейронних мережах, які здатні певною мірою моделювати роботу людського мозкупід час обробки даних. Ці мережі здатні навчатися та аналізувати складні набори даних, які складно обробляти за допомогою лінійних алгоритмів.

У цих програмах використовуються розмитий алгоритм, що дозволяє відшукувати слова у їхніх словникових формах, а й у інших формах, наприклад, у іншому відмінку. Крім того, вони можуть знаходити словосполучення в іншому порядку слів. Самоорганізована штучна нейронна мережа здатна знаходити закономірності та визначати взаємозв'язки між ними. Програма порівнює той фрагмент, над яким ви зараз працюєте, із вмістом бази даних, та надає цю інформацію на дисплей. Вона може встановити, що даний фрагмент схожий на аналогічний фрагмент, наявний у пам'яті системи, наприклад, 99%, 74%, або навіть 20%.

Кожному перекладачеві знайоме відчуття, що фраза, над якою він зараз б'ється, вже десь, колись зустрічалася хоча б у приблизному вигляді. Причому траплялася або в цьому ж матеріалі, або в якомусь іншому, яке раніше перекладалося. Прямо дежавю якесь… Подивитися її, цю фразу, хоча б для довідки, щоб толково сформулювати ту, над якою працюєш зараз…

Починаєш гортати оригінал назад, ритися на книжковій полиці. І часто бувало так, що шукана фраза справді виявлялася. Найчастіше, коли вже пізно, після того, як робота над перекладом закінчена. Здається, в таку хвилину все віддав би за засіб, який допоміг би знайти необхідний текст. Навіть зараз, коли друкуєш текст перекладу за допомогою комп'ютера, а не на друкарській машинці, завжди шкода переробляти те, що складалося так важко. Давня мрія перекладача - придумати будь-який засіб, який би звільняв від необхідності перекладати ту саму фразу кілька разів.

Така ідея лежить в основі створення технології Translation Memory, або просто ТМ, на основі якої з кінця 80-х - початку 90-х років почали з'являтися більш менш працездатні програми. По суті, така програма є керуючою оболонкою, яка працює з тією чи іншою базою даних (ТМ), що підключається, і яку я б назвав скарбничкою перекладів. ТМ - це комп'ютеризована версія великої картотечної шафи, в якій зберігається кожна фраза, яку ви коли-небудь перекладали, причому в парі - як мовою оригіналу, так і перекладу. Кожна така пара називається білінгва. Програма миттєво нагадає вам, як цю фразу перекладали минулого разу. Доступ до інформації легкий та швидкий.

Огляд основних програм класу Translation Memory

В даний час на світовому ринку представлено декілька програмних продуктів, які використовують технологію ТМ. Вони відрізняються один від одного, і часом суттєво. Водночас їм усім притаманні деякі спільні функціональні можливості.

Наприклад, у них, як правило, передбачений текстовий редактор, що має два паралельні вікна. Одне вікно призначене для тексту оригіналу, друге – для перекладу. Коли у вікно оригіналу виводиться вихідний фрагмент тексту (це може бути пропозиція, абзац, окреме слово), починається пошук аналогічного фрагмента базі даних. Якщо в пам'яті виявився такий самий фрагмент, він виводиться у вікно перекладу автоматично. Якщо точно такого ж фрагмент не знайшлося, але виявився якийсь схожий, то у вікно програми виводиться знайдений фрагмент із зазначенням відсотка збігу.

Перекладач редагує запропонований програмою текст перекладу, приводячи його у відповідність до оригіналу, посилає його на згадку бази даних і приступає до наступного. Якщо нічого не знайшлося взагалі, перекладач переводить його з нуля, вдруковуючи текст у віконце перекладу. Закінчивши роботу над цим фрагментом, перекладач посилає його на згадку бази даних і приступає до наступного. Таким чином, поповнення ТМ відбувається автоматично в міру роботи. Відразу після того, як білінгва потрапила до ТМ, вона стає доступною для користувача. Якщо ТМ-програма розташована на мережному дискуі з нею працюють інші користувачі, то нова білінгва відразу стає доступною і для інших перекладачів. Після того, як фрагмент оригіналу та фрагмент перекладу відправлені до бази даних, у вікно оригіналу виводиться наступний фрагмент.

Першу програму такого типу, що отримала назву Translation Manager, розробила фірма IBM. Спочатку IBM використовувала Translation Manager для потреб - для локалізації (адаптації на іноземні мови) власного програмного забезпечення. Потім Translation Manager був запропонований ринку як комерційний продукт, і деякий час він був монополістом у цій галузі. Ця програма досить проста у використанні, відрізняється швидкодією та забезпечує гарні можливості для індивідуальних налаштувань користувача. Для кожної з трьох основних функцій передбачені окремі вікна - Translation, Translation Memory та Dictionary. У вікні Translation Memory відображаються знайдені у пам'яті відповідності, якщо вони є, а у вікно Dictionary виводиться термінологія зі словників, розроблених IBM. Є в цій програмі деякі незручності, наприклад, ускладнена процедура пошуку в скарбничці пам'яті (Translation Memory) окремих слів.

Ще одна програма – SDLX – розроблена для своїх власних потреб англійською компанією SDL, що займається локалізацією програмного забезпечення Кожна програма, що входить у комплект, встановлюється окремо. SDL Edit – це, власне, сама програма, за допомогою якої здійснюється переклад. У ній є три вікна, що показують вихідний текст, переклад та Translation Memory. Слід зазначити, що документ для перекладу не можна імпортувати безпосередньо до SDL Edit. Спочатку його необхідно перетворювати за допомогою SDL Convert, що є певною незручністю.

Програма Déjà Vuкористується у перекладачів у Європі популярністю завдяки своїй гнучкості та адаптивності. Крім зручності, Déjà Vu відрізняється від інших продуктів найвищим співвідношенням ціна/якість. У порівнянні з двома попередніми програмами аналізований продукт має низку зручних можливостей. Фахівці відзначають, що від початку ця програма розроблялася в контакті з її майбутніми користувачами. Відомо, що остання версія Déjà Vu тестувалась, зокрема, російськими перекладачами. Один із них, Андрій Герасимов, написав позитивну рецензію на цю програму у журналі MultiLingual Computing & Technology

Відома в нашій країні та популярна в Європі програма STAR Transit. За своєю ідеологією вона зовсім не схожа на інші продукти класу, що розглядається. Ви вже отримали певне уявлення про них, і знаєте, що вони мають центральну базу даних великої ємності, скарбничку перекладів, у якій потрібні дані виявляються миттєво (якщо вони є, звичайно). Як сказав би Білл Гейтс: "Information at your fingertips". Так ось, всі програми Translation Memory мають електронну каталожну шафу, а Transit - не має. У нього все по-іншому. Вихідні дані та переклад зберігаються у текстовому форматі у вигляді файлів, які перекладач розміщує в директоріях на власний розсуд. Потім перекладач може просто вказати програмі які директорії і навіть які файли йому необхідні. Потім Transit формує асоціативну мережу посилань, з якою ведеться робота. Незважаючи на окремі плюси, в Росії Transit не набув широкого поширення. У кінцевому підсумку Promt, офіційний дистриб'ютор Transit, переключився на дистрибуцію Translator's Workbench фірми Trados.

А от Translator's Workbench, або просто Традос, швидко набув широкого поширення в Росії, спочатку серед перекладацьких фірм, а потім і серед індивідуальних перекладачів. Напевно, це можна пояснити тим, що він дає можливість працювати, не виходячи з Word'a, що психологічно комфортніше. Кому приємно дивитися на текст, поцяткований всілякими кодами квадратних дужках? Translator's Workbench (Традос) у порівнянні з іншими програмами зручніший для звичайного перекладача, який не є фахівцем з програмування, він більш зрозумілий у порівнянні з іншими програмами такого типу. Зокрема, кнопки управління забезпечені підказками. Перебуваючи у знайомому та зрозумілому Word'і, можна використовувати всі його інструменти (наприклад, автотексти).

Цей продукт має повним наборомкорисних інструментів, які у інших програмах присутні лише у тому чи іншою мірою. Одним із таких інструментів є Analise, що дозволяє заздалегідь проаналізувати текст оригіналу та з'ясувати, чи є там (і в якій кількості) повні та неповні збіги. Варто згадати і таку зручний інструмент, як Placeables, що дозволяє, наприклад, автоматично змінювати цифри в тексті, якщо все інше у фрагменті, що перекладається, збігається з виявленим у скарбничці перекладів (ТМ). Дуже зручна автоматична функціязаміни в цифрах десяткових точок та/або ком, формату часу, абревіатур і т.д. на відповідні параметри, що задаються перекладачем.

Переважна більшість російських перекладачів, що використовують технологію TM, віддають перевагу Translator's Workbench (Традос).

Що спільного у програм Translation Memory

p align="justify"> Резюмуючи опис основних програмних продуктів класу Translation Memory, слід відзначити наявність у них, як правило, ряду загальних функціональних можливостей.

Відомості - Alignment

Ця функція дозволяє створювати скарбнички перекладів (ТМ) з існуючих файлів. З двох файлів – один із текстом оригіналу, а інший із текстом перекладу – створюється набір білінгв. Навпроти пропозиції вихідного тексту вибудовується його переклад. І так по всіх файлах, які перекладач звів у єдину скарбничку. Ступінь зручності функції суміщення у різних програмрізна.

Обслуговування – Maintenance

У міру накопичення в базі даних білінгу їх кількість може збільшитися настільки, що вміст бази може вийти за всі межі. Можуть виявитись якісь неточності і навіть помилки, особливо якщо програма використовується в мережі багатьма користувачами. Виникне необхідність щось відредагувати чи уточнити, або навіть просто видалити. Задля справедливості треба сказати, що згаданий засіб обслуговування програм до кінця цю проблему не вирішує - боротися на практиці із засміченням скарбничок перекладів все одно важко.

Термінологічний словник - Terminology Program

Всі програми мають свої термінологічні словники, які є по суті відомими всім електронними словниками. Термінологічні словники можуть імпортувати файли у форматі словників або глосаріїв, їх можна вручну поповнювати.

Текстовий редактор - Document Editor

Тут, власне, здійснюється процес перекладу. Для цього у всіх програм передбачені згадувані вище два вікна - для вихідного тексту та для його перекладу. Усі текстові редактори мають можливість встановлювати у відсотках ступінь подібності між перекладеним у Наразівихідним текстом та текстом у скарбничці перекладів. Чим вище ви встановите відсоток подібності, наприклад, 90% або 95%, тим менша ймовірність виявлення відповідного тексту. Однак можна встановити менший відсоток, тоді може набратися чимало матеріалу, який був би корисний хоча б для довідки.

Конкорданс (Зв'язування слововживання з контекстом) - Concordance

Це дуже корисна функція всіх програм, що розглядаються. Нерідко буває, що термін (або поєднання термінів) може мати кілька значень чи відтінків значень. Виділивши термін, можна переглянути у вікні всі білінгви, що є в скарбничці, причому в різних контекстах. Це завжди полегшує вибір найточнішого варіанта перекладу даного терміна чи поєднання.

Наталія Шахова, директор агентства EnRus, вважає, що більшість TM-продуктів позбавляють користувача необхідності знайомитися з різними текстовими процесорами. Достатньо вивчити особливості текстового редакторасамого продукту, і вам стане підвладна вся різноманітність текстів, будь вони представлені в QuarkXPress, FrameMaker або Adobe Illustrator. Тут є, звичайно, деяка каверза: для того щоб освоїти черговий текстовий процесорабо видавничу систему, вам знадобиться відповідна програма-фільтр, яка – що? Правильно – продається за окремі гроші! Взагалі грошове питання найсерйозніше, коли йдеться про TMT. Коштують вони недешево (як правило, кілька сотень доларів), сумісності, ясна річ, немає. Тому якщо ви придбали (і освоїли!) якийсь продукт для одного проекту, то для наступного може знадобитися придбати інший продукт і знову витрачати час на його вивчення.

Далі Наталія Шахова зазначає, що на Заході вже обговорюють наслідки повсюдного поширення таких програм. Одне полягає в тому, що перекладач-новачок втрачає можливість вийти на ринок. Так само, як у Росії вже дуже важко отримати замовлення перекладачеві, якщо у нього немає комп'ютера та принтера, так і за кордоном виникають проблеми працевлаштування у перекладачів, які не мають TM-програми. Це явище має і позитивну сторону - наймаючи працювати власника TM-програми, замовник отримує деяку гарантію його професіоналізму. Але ж новачки повинні мати можливість стартувати!

Ставлення до технології Translation Memory у нашій країні різне.

Коли в 1999 році бюро перекладів "Фонетикс" почало працювати з Trados Translator's Workbench, то, природно, під час контактів із замовниками ми розповідали про перехід на нову технологію. Попри очікування, реакція була настороженою, а часом і просто негативною. Виявилося, що ідея машинного перекладу була скомпрометована бездумним застосуванням у 90-х роках програм типу Stylus і Socrat. Причому їх нерідко використовували перекладачі, скажімо, не дуже високої кваліфікації, які не турбували себе редагуванням того, що видавали "електронні перекладачі". Втім, користувачів цих програм теж можна зрозуміти – редагування цих текстів вимагало багато часу та сил.

Навіть зараз часом можна зустріти з боку замовників з-поміж російських організацій насторожене ставлення до будь-яких новацій у сфері програмного забезпечення для перекладів. Натомість іноземні фірми, навпаки, вимагають застосування програм класу Translation Memory. Найчастіше у них є переваги, в основному це Trados Translator's Workbench, а також Star Transit. У них нерідко є готові ТМ (скарбнички перекладів), які пропонують використовувати.

Що стосується перекладачів, то вони мають до технології Translation Memory цілком зрозумілий інтерес. Ще більш зрозумілий інтерес мають до них бюро перекладів. Вони мають справу не так з художньою літературою, публіцистикою, поезією і т.д., як з інструкціями з експлуатації, посібниками з пошуку та усунення несправностей, а також з локалізацією програмного забезпечення, тобто. з тими матеріалами, де є фрагменти тексту, що повторюються або схожі.

У своєму нинішньому вигляді програми Translation Memory, мабуть, досягли стелі. Подальша робота щодо їх доопрацювання йде шляхом удосконалення їх існуючих функціональних можливостей. Це веде до того, що програми стають все більш громіздкими та складними, і це при тому, що якихось принципово нових ідей там немає. Той же Translator's Workbench (Традос) у своїй останньої версіїоброс таким набором інструментів, що простому користувачевірозібратися у них дуже складно.

Експлуатація цієї програми передбачає наявність у штаті бюро перекладів окремого працівника. Крім посібника користувача, у документації передбачено посібник для виділеного спеціаліста (TRADOS Specialist Guide). Крім цього в пакет документації входить Project Management Guide, MultiTerm User Guide та WinAlign User Guide. Навіть у підготовленого перекладача на ознайомлення з сотнями сторінок цих документів буде потрібно багато сил і часу.

Пошуком нових рішень займається група дослідників в університеті Меріленд, округ Балтімор (США), під керівництвом професора С.Ніренбурга, відомого фахівця в галузі штучного інтелекту та машинного перекладу. Поки що розробки знаходяться на стадії теоретичних досліджень, і швидше за все, доведення цих досліджень до стадії комерційного продукту вимагатиме значного часу.

Привертає увагу та обставина, що у ринку інструментів перекладача працюють переважно зарубіжні фірми. Хотілося б сподіватися, що це не триватиме вічно. Потенціал теоретичних розробок російських фахівців у галузі семантичного аналізу дуже великий. Наші дослідження в цій галузі досягли високого рівня. Існують всі підстави розраховувати, що ці розробки будуть матеріалізовані у вигляді принципово нових лінгвістичних технологій, які дозволять повною мірою розкрити творчий потенціал перекладача.

Журнал практикуючого перекладача"Мости", одне з небагатьох професійних періодичних видань для перекладачів. У журналі публікуються статті перекладачів різних спеціальностей як усних, так і письмових. На сторінках журналу перекладачі, що спеціалізуються на різних галузях знань, мають можливість обговорювати актуальні проблеми, полемізувати один з одним, ділитися секретами професійної майстерності

Пам'ять перекладів або Translation memory

Пам'ять перекладів (ПП, англ. translation memory, TM іноді звана "Накопичувач перекладів") - база даних, що містить набір раніше перекладених текстів. Один запис у такій базі даних відповідає «одиниці перекладу» (англ. translation unit), за яку зазвичай приймається одна пропозиція (рідше - частина складносурядної пропозиції, або абзац). Якщо чергова пропозиція вихідного тексту точно збігається з пропозицією, що зберігається в базі (точна відповідність, англ. exact match), вона може бути автоматично підставлена ​​в переклад. Нова пропозиція може також трохи відрізнятися від того, що зберігається в базі (неточна відповідність, англ. Fuzzy match). Така пропозиція може бути також подана у переклад, але перекладач буде повинен внести необхідні зміни.

Крім прискорення процесу перекладу повторюваних фрагментів та змін, внесених у вже переведені тексти (наприклад, нових версій програмних продуктів чи змін у законодавстві), системи Translation Memory також забезпечують однаковість перекладу термінології в однакових фрагментах, що особливо важливо при технічному перекладі. З іншого боку, якщо перекладач регулярно підставляє у свій переклад точні відповідності, вилучені з баз перекладів, без контролю їх використання у новому контексті, якість перекладеного тексту може погіршитися.

У кожній конкретній системі Translation Memory дані зберігаються у своєму власному форматі (текстовий формат у Wordfast, база даних Access у Deja Vu), але існує міжнародний стандарт TMX (англ. Translation Memory eXchange format), який базується на XML і який можуть породжувати практично всі системи ПП. Завдяки цьому результати роботи перекладачів можна обмінювати між додатками, тобто перекладач, що працює з OmegaT, може використовувати пам'ять перекладів, створену в ТРАДОСі (Trados) і навпаки.

Більшість систем Translation Memory як мінімум підтримують створення та використання словників користувача, створення нових баз даних на основі паралельних текстів (англ. alignment), а також напівавтоматичне вилучення термінології з оригінальних та паралельних текстів.

Список програмних систем Translation memory (пам'яті перекладів)

Відповідно до недавніх оглядів використання систем пам'яті перекладів (translation memory)до найпопулярніших систем відносяться.

ТМ – база даних, де зберігаються виконані переклади. Технологія ТМ працює за принципом накопичення: у процесі перекладу ТМ зберігається вихідний сегмент (пропозиція) та його переклад. При обробці нового тексту, що надійшов переклад, система порівнює кожну його пропозицію зі збереженими у основі сегментами. Якщо ідентичний або подібний вихідний сегмент знайдено, то переказ цього сегмента відображається разом із переказом та зазначенням збігу у відсотках. Слова та фрази, які відрізняються від збереженого тексту, виділяються підсвічуванням. Таким чином, перекладачеві залишається перекласти лише нові сегменти та відредагувати частково збігаються. Кожна зміна або новий переклад зберігаються у ТМ. А в результаті немає необхідності двічі перекладати одну й ту саму пропозицію.

З іншого боку, при роботі з великими проектамиперекладач стикається з проблемою узгодженого застосування термінологічного глосарію в ході тривалого проекту або швидкого повторного використання тексту, який було переведено раніше. За своєю природою подібні рутинні завданняпорівняно легко (на відміну машинного перекладу) формалізуються і програмуються.

Кожен запис бази даних ТМ є одиницю (пропозиція або абзац) паралельних текстів (як правило, двома мовами). Така база даних зберігає попередні переклади з метою їхнього можливого повторного використання та вирішення завдань швидкого пошуку вмісту. Незважаючи на те, що програми, оснащені пам'яттю перекладу, називаються системами автоматизованого перекладу (CAT, computer-aided/assisted translation), їх не слід плутати з програмами машинного перекладу – пам'ять перекладу нічого не перекладає сама по собі, в той час як машинний переклад заснований на генерації перекладів за результатами граматичного аналізу вихідного тексту.

Як правило, запис пам'яті перекладу складається з двох сегментів: вихідною (source) і кінцевою (target) мовами. Якщо ідентичний (або схожий) сегмент вихідною мовою зустрічається в тексті, сегмент кінцевою мовою буде знайдений у пам'яті перекладу та запропонований перекладачеві як основа для нового перекладу. Автоматично знайдений текст може бути задіяний як є, редагований або повністю відкинутий. Більшість програм використовують алгоритм нечіткої відповідності (fuzzy matching), що істотно покращує їх функціональні можливості, оскільки в цьому випадку можна знаходити пропозиції, що лише віддалено нагадують шукані фрази, але, проте, придатні для подальшого редагування.

Переваги від використання такого програмного забезпечення спочатку можуть бути неочевидними – однак у міру наповнення бази даних результати автоматичної підстановки основ для перекладу будуть все більш точними та регулярними.

Архітектура автоматизованої системи та її функціональні можливості можуть відрізнятися. Кошти пошуку можуть працювати як з цілими сегментами, так і з окремими словами або фразами, дозволяючи перекладачеві виконувати термінологічний пошук. У систему також включають окрему програмудля роботи з глосарієм, що містить затверджені для застосування у проекті терміни. Деякі системи працюють із програмами машинного перекладу. Основний робочий інтерфейс або вбудовується безпосередньо в наявний текстовий процесор, такий як Word, або є окремим редактором. До складу системи обов'язково включають фільтри для імпорту-експорту файлів різних форматів. Крім того, багато систем, якщо не всі, мають засіб для додавання в пам'ять перекладу сегментів з, як правило, наявних у перекладача старих перекладених файлів.

Те, що стосується поняття «навчання мови», можна застосувати і до «Translation Memories».

«Порожня» система запам'ятовує терміни та пропозиції.

Будується пам'ять перекладів - Translation Memory (TM).

TM стає "мовною пам'яттю" по продукту або діяльності компанії в цілому.

Системи ТМ: SDLX, TRADOS, Deja Vu, Star Transit, Trans Suite 2000, WordFast, WordFisher, ACROSS.

КОМБІНОВАНІ СИСТЕМИ

Технології МП та ТМ одна одну доповнюють, але ніяк не дублюють. Система МП готова до використання відразу після установки (хоча це не виключає того, що в процесі роботи користувачеві захочеться щось змінити у словнику, алгоритмах перекладу тощо). Систему ТМ необхідно спеціально налаштовувати на переклад текстів у певній галузі, і що більше ці тексти одне одного схожі (наприклад, така система використовується для перекладу стандартних договорів), тим менше часу потрібно налаштування.

У зв'язку з цим цілком логічно поява гібридів – example-based machine translation – програм, що поєднують системи машинного перекладу та ТМ (наприклад, компанія «ПРОМТ» створила інтегровану технологію PROMT Term та PROMT For TRADOS, яка об'єднує систему TM TRADOS та систему машинного перекладу – PROMT XT Professional). PROMT For TRADOS (P4T) призначена для інтеграції системи машинного перекладу PROMT та системи ТM TRADOS:

Переклад у системі TRADOS;

Переклад у системі PROMT не знайдених у ТМ сегментів;

Вставка перекладених PROMT сегментів у TM.

Схема автоматизованого ланцюжка перекладу на основі інтегрованої технології PROMT-TRADOS

Застосування інтегрованої технології робить процес перекладу великих масивів документації керованим та підвищує його економічну ефективність.

Приклад реалізації проектів із застосуванням інтегрованої технології PROMT-TRADOS.

Припустимо, необхідно здійснити переведення інструкції до міні-АТС.

1. На першому етапі застосовується програма PROMT TerM. Документи аналізуються і виявляється основна термінологія, яка заноситься до словників системи машинного перекладу PROMT.

2. Виконується машинний переклад (МП) із підключеним словником, продовжується термінологічна робота з корекції словника.

3. Результати МП коригуються і заносяться до ТМ документа, що перекладається.

4. Таким чином користувач отримує:

Термінологічний словник;

Перекладений документ;

Відповідну перекладеному документу TM, яка може бути використана в подальшій роботі з подібними документами.

Системи автоматичного проектування

САПР – програмне забезпечення, призначене для створення креслень, конструкторської та технологічної документації, а також 3D-моделей. У даний списоквключені найпоширеніші CAx-програми (CAD, CAM, CAE).

Говорячи про автоматизований переклад, зазвичай мають на увазі програми, що здійснюють переклад на основі технології машинного перекладу (Machine Translation). Однак існує й інша технологія - Translation Memory, яка хоч і не так широко відома російським користувачам, проте має ряд переваг.

Бурхливий розвиток технічного прогресу призвів до збільшення числа технічних пристроїв, машин та іншої складної техніки, без яких життя сучасної людини практично немислиме. Наприклад, обсяг документації для європейського літака Airbus нараховує десятки тисяч сторінок. Як показують дані дослідження, проведеного наприкінці 2004 року асоціацією LISA (LISA 2004 Translation Memory Survey), 42% опитаних переводять близько 1 млн. слів на рік, у 24% компаній - учасників опитування щорічний обсяг перекладів становить 1-5 млн., 12 % переводять від 5 до 10 млн., обсяг перекладів інших підприємств - від 10 до 500 і більше мільйонів слів на рік. Зокрема більшість виробників сьогодні не обмежуються своїм локальним ринком і активно освоюють регіональні ринки. У цьому локалізація продукції, зокрема переклад опису продукту на місцеву мову, одна із обов'язкових умов виходу новий ринок.

У той же час, хоча виробники регулярно випускають нові версії своїх продуктів - автомобілів, екскаваторів, комп'ютерів та мобільних телефонів, програмного забезпечення, - далеко не всі їх принципово відрізняються від попередніх моделей. Іноді нова модель телефону є трохи зміненою (або рестайлінговою) попередньою моделлю. Нові версії продаються краще, тому виробникам доводиться регулярно оновлювати свої продукти. У результаті документація щодо кожного з таких продуктів найчастіше на 70-90% збігається з тією, що була в попередній версії.

Два чинника - великий обсяг які вимагають перекладу документів та його висока повторюваність - послужили стимулом до створення технології Translation Memory (скорочено називається TM, загальноприйнятий російський переклад цього терміна відсутня). Суть технології TM можна образно передати однією фразою: «Не перекладати той самий текст двічі». Інакше висловлюючись, Translation Memory використовується повторного використання раніше зроблених перекладів. Це дозволяє серйозно скоротити час на підготовку перекладу, особливо під час роботи з текстами, які мають високий рівень повторюваності.

Технологію Translation Memory часто плутають з машинним перекладом (Machine Translation), яка, безумовно, теж корисна та цікава, але її опис не є метою цієї статті. Використання технології ТМ підвищує швидкість перекладу рахунок зменшення обсягу механічної роботи. Однак важливо відзначити, що TM не виконує перекладу за перекладача, а є потужним інструментом для скорочення витрат при перекладі текстів, що повторюються.

Технологія ТМ працює за принципом накопичення результатів перекладу: у процесі перекладу базі ТМ зберігаються вихідний текст та її переклад. Для полегшення обробки інформації та порівняння різних документів, система Translation Memory розбиває весь текст на окремі шматочки, які називаються сегментами. Такими сегментами найчастіше є пропозиції, але можуть бути й інші правила сегментації. При завантаженні нового тексту система TM здійснює сегментування і порівнює сегменти вихідного тексту з наявними в підключеній базі перекладів. Якщо системі вдається знайти повністю або частково збігається сегмент, його переклад відображається із зазначенням збігу у відсотках. Сегменти, які відрізняються від збереженого тексту, виділяються підсвічуванням. Таким чином, перекладачеві залишається лише перекласти нові сегменти та відредагувати частково збігаються.

Як правило, визначається поріг збігів на рівні не нижче 75%, оскільки якщо встановити менший відсоток збігів, то збільшаться витрати на редагування тексту. Кожна зміна або новий переклад зберігаються в ТМ, так що немає необхідності перекладати те саме двічі!

Важливо також постійно поповнювати базу Translation Memory, зберігаючи у базі (чи базах, якщо переклад виконується з різних тематикам) пари сегментів «вихідний текст - правильний переклад». Це дозволить значно скоротити час, необхідний перекладу подібних текстів. Крім зниження трудомісткості перекладу, система TМ дозволяє витримати єдність термінології та стилю у всій документації.

Використання технології ТМ забезпечує перекладачеві такі переваги:

  • підвищення продуктивність праці. Підстановка навіть на 80% сегментів, що збігаються, з бази перекладів може скоротити час роботи над перекладом на 50-60%. Як показує практика, набагато ефективніше правити вже готовий переклад, ніж перекладати заново - з нуля;
  • єдність термінології та стилю за наявності бази перекладів за тематикою документа, що перекладається. Це особливо важливо під час перекладу вузькоспеціальної документації;
  • організація роботи колективу перекладачів із гарантованою якістю перекладу завдяки доступу до загальної бази Translation Memory.

Окремо зазначимо, що в західних країнах, де технологія Translation Memory давно вже стала де-факто обов'язковим інструментом перекладача, кошти, витрачені на створення бази перекладів, розглядаються не як витрати, а скоріше як інвестиції в стабільну та якісну роботу, що не збільшує не лише прибуток, а й вартість самої компанії.

Ринок систем Translation Мemory

Безперечним лідером на ринку систем Translation Memory є програми SDL-TRADOS. Влітку 2005 року відбулося об'єднання двох найбільших розробників систем ТМ - компаній SDL та TRADOS (програмні продукти під торговою маркою TRADOS добре відомі багатьом користувачам), і тепер вони випускають спільний продукт, який є законодавцем стандартів у галузі Translation Memory.

Нова система SDL-TRADOS має розширені (настроювані користувачем) функціональні можливості нечіткої відповідності (пошук за збігами в базі перекладів), а також інструментарій для перевірки якості документів, що перекладаються. Програма здійснює перевірку орфографії та захищає вміст блоків пам'яті за допомогою технології шифрування.

Система підтримує такі формати, як Word DOC та RTF, online help RTF, PowerPoint, FrameMaker, FrameMaker +SGML, FrameBuilder, Interleaf, QuickSilver, Ventura, QuarkXPress, PageMaker, SGML/HTML/XML, включаючи HTML Help, RC (Windows Resource) , Bookmaster (DCF) та Troff. Крім системи SDL-TRADOS, на IT-ринку є інші системи ТМ. Особливо широко представлені французькі виробники.

Система французької компанії Atril (www.atril.com) називається. Її розробники спочатку організували власне бюро перекладу технічної документації, після чого виникла ідея створення спеціалізованого програмного забезпечення на основі технології Translation Memory.

Це самостійний додаток із систематизованим меню. Система може створювати бази ТМ, і навіть бази даних термінології і підключати словники. Процес перекладу здійснюється у спеціальній оболонці Project, куди при її створенні прикріплюється файл, який необхідно перекласти, та підключаються додаткові налаштування: база ТМ, словники та ін. Текст перекладається у спеціальній таблиці, де навпроти кожної графи його оригіналу потрібно заповнити варіант перекладу. До переваг також відноситься додаткова функціядля перекладу файлів різних форматів, що дозволяє зберегти вихідне форматування файлу.



Розповісти друзям