ट्रांसलेशन मेमोरी क्या है और यह कैसे काम करती है? अनुवाद स्मृति प्रौद्योगिकी. पूर्व-अनुवाद के माध्यम से अनुवाद स्मृति का अनुप्रयोग

💖क्या आपको यह पसंद है?लिंक को अपने दोस्तों के साथ साझा करें

(कम अक्सर - एक जटिल वाक्य का हिस्सा, या एक पैराग्राफ)। यदि स्रोत पाठ की अनुवाद इकाई डेटाबेस में संग्रहीत अनुवाद इकाई से बिल्कुल मेल खाती है (सटीक मिलान, अंग्रेजी। सटीक मिलान), इसे स्वचालित रूप से अनुवाद में डाला जा सकता है। नया खंड डेटाबेस में संग्रहीत खंड (फ़ज़ी मिलान) से थोड़ा भिन्न भी हो सकता है। फजी मैच). ऐसा खंड अनुवाद में भी डाला जा सकता है, लेकिन अनुवादक को आवश्यक परिवर्तन करने होंगे।

दोहराए गए अंशों की अनुवाद प्रक्रिया को तेज करने और पहले से अनुवादित पाठों में किए गए परिवर्तनों (उदाहरण के लिए, सॉफ्टवेयर उत्पादों के नए संस्करण या कानून में बदलाव) के अलावा, पीपी सिस्टम समान अंशों में शब्दावली के अनुवाद में एकरूपता भी सुनिश्चित करते हैं, जो है तकनीकी अनुवाद में विशेष रूप से महत्वपूर्ण है। दूसरी ओर, यदि कोई अनुवादक नियमित रूप से अनुवाद डेटाबेस से निकाले गए सटीक मिलान को नए संदर्भ में उनके उपयोग की निगरानी किए बिना अपने अनुवाद में प्रतिस्थापित करता है, तो अनुवादित पाठ की गुणवत्ता खराब हो सकती है।

प्रत्येक विशिष्ट सॉफ़्टवेयर सिस्टम में, डेटा अपने आप में संग्रहीत होता है अपना प्रारूप(वर्डफ़ास्ट, डेटाबेस में टेक्स्ट प्रारूप एक्सेस्स डेटादेजा वु में), लेकिन एक अंतरराष्ट्रीय मानक TMX (इंग्लैंड) है। अनुवाद मेमोरी ईएक्सचेंज प्रारूप ), जो XML पर आधारित है और जिसे लगभग सभी सॉफ्टवेयर सिस्टम द्वारा उत्पन्न किया जा सकता है। इसके लिए धन्यवाद, किए गए अनुवादों का उपयोग किया जा सकता है विभिन्न अनुप्रयोग, अर्थात, ओमेगाटी के साथ काम करने वाला एक अनुवादक TRADOS में बनाए गए पीपी का उपयोग कर सकता है और इसके विपरीत।

अधिकांश सॉफ़्टवेयर सिस्टम कम से कम उपयोगकर्ता शब्दकोशों के निर्माण और उपयोग, समानांतर पाठों पर आधारित नए डेटाबेस के निर्माण का समर्थन करते हैं। संरेखण), साथ ही मूल और समानांतर ग्रंथों से शब्दावली का अर्ध-स्वचालित निष्कर्षण।

लोकप्रिय पीपी सॉफ्टवेयर सिस्टम

पीपी सिस्टम के उपयोग की समीक्षाओं के अनुसार, सबसे लोकप्रिय सिस्टम में शामिल हैं:

अंग्रेजी विकिपीडिया में विभिन्न प्रणालियों की क्षमताओं की तुलना करने वाली एक सूची है।

अनुवाद स्मृति मानक और प्रारूप

  • TMX (ट्रांसलेशन मेमोरी एक्सचेंज फॉर्मेट - ट्रांसलेशन मेमोरी एक्सचेंज) फॉर्मेट। यह मानक विभिन्न अनुवाद मेमोरी प्रदाताओं के बीच आदान-प्रदान को सक्षम बनाता है। TMX अनुवादकों के बीच एक सामान्य प्रारूप है और अनुवाद स्मृतियों को आयात और निर्यात करने के लिए सबसे उपयुक्त है। इस प्रारूप का नवीनतम संस्करण - 1.4बी आपको टीएमएक्स फ़ाइल से स्रोत दस्तावेज़ों और उनके अनुवाद को पुनर्स्थापित करने की अनुमति देता है।
  • टीबीएक्स (टर्मबेस एक्सचेंज प्रारूप - शब्दावली बेस एक्सचेंज)। यह LISA (स्थानीयकरण उद्योग संघ) प्रारूप वर्तमान में ISO 30042 के अनुसार संशोधित और पुनः जारी किया जा रहा है। यह मानक विस्तृत शाब्दिक जानकारी सहित शब्दावली के आदान-प्रदान की अनुमति देता है। टीबीएक्स का मुख्य आधार मानकों द्वारा परिभाषित किया गया है: आईएसओ 12620, आईएसओ 12200 और आईएसओ 16642। आईएसओ 12620 मानकीकृत नामों के साथ अच्छी तरह से परिभाषित "डेटा श्रेणियों" की एक रजिस्ट्री प्रदान करता है जो डेटा तत्व प्रकार या पूर्वनिर्धारित मानों के रूप में कार्य करते हैं। ISO 12200 (जिसे MARTIF के नाम से भी जाना जाता है) TBX ढांचे के लिए आधार प्रदान करता है। आईएसओ 16642 (जिसे शब्दावली मार्कअप फ्रेमवर्क के रूप में भी जाना जाता है) में सामान्य रूप से शब्दावली मार्कअप भाषाओं के लिए एक संरचनात्मक मेटामॉडल शामिल है।
  • एसआरएक्स को टीएमएक्स प्रारूप में सुधार करने और कार्यक्रमों के बीच अनुवाद मेमोरी एक्सचेंज को अधिक कुशल बनाने के लिए डिज़ाइन किया गया है। पिछले अनुवाद में उपयोग किए गए विभाजन नियमों को निर्दिष्ट करने की क्षमता पीपी की सामग्री के साथ वर्तमान पाठ में खंडों की पहचान करने की दक्षता को बढ़ाती है।
  • GMX GILT का मतलब वैश्वीकरण, अंतर्राष्ट्रीयकरण, स्थानीयकरण और अनुवाद है। GILT मेट्रिक्स मानक में तीन भाग होते हैं: वॉल्यूम मेट्रिक्स के लिए GMX-V, जटिलता मेट्रिक्स के लिए GMX-C और गुणवत्ता मेट्रिक्स के लिए GMX-Q। प्रस्तावित GILT मेट्रिक्स मानक का उद्देश्य GILT कार्यों को लागू करते समय कार्य के दायरे और गुणवत्ता आवश्यकताओं को निर्धारित करना है।
  • OLIF एक XML-संगत खुला मानक है जिसका उपयोग शब्दावली और शाब्दिक डेटा के आदान-प्रदान के लिए किया जाता है। हालाँकि इसका उपयोग मूल रूप से मालिकाना मशीन अनुवाद शब्दकोशों के बीच शाब्दिक डेटा का आदान-प्रदान करने के एक तरीके के रूप में किया गया था, यह प्रारूप धीरे-धीरे शब्दावली विनिमय के लिए एक अधिक सामान्य मानक के रूप में विकसित हुआ है।
  • एक्सएलआईएफएफ (एक्सएमएल स्थानीयकरण इंटरचेंज फ़ाइल प्रारूप - स्थानीयकरण के दौरान आपसी आदान-प्रदान के लिए एक्सएमएल प्रारूप), आपसी आदान-प्रदान के लिए एकल फ़ाइल प्रारूप के रूप में बनाया गया है जिसे हर किसी द्वारा मान्यता प्राप्त है सॉफ़्टवेयरस्थानीयकरण. एक्सएलआईएफएफ अनुवाद उद्योग में एक्सएमएल प्रारूप में सूचनाओं के आदान-प्रदान का सबसे अच्छा तरीका है।
  • ट्रांसडब्ल्यूएस (अनुवाद वेब सेवाएँ) स्थानीयकरण परियोजनाओं से संबंधित फ़ाइलें और संदेश भेजते और प्राप्त करते समय वेब सेवाओं को कॉल करने के लिए आवश्यक मापदंडों को परिभाषित करता है। इसकी कल्पना इंटरनेट पर सेवाओं का उपयोग करके स्थानीयकरण प्रक्रिया को स्वचालित करने के लिए एक व्यापक प्रणाली के रूप में की गई थी।
  • xml:tm, अनुवाद मेमोरी का यह दृष्टिकोण टेक्स्ट मेमोरी की अवधारणा पर आधारित है, जो आपको लेखक मेमोरी और अनुवाद मेमोरी को संयोजित करने की अनुमति देता है। XML-INTL द्वारा लिसा OSCAR को xml:tm प्रारूप प्रदान किया गया था।

फायदे और नुकसान

लाभ

  • अनुवादक के काम का समय और मात्रा कम करना
  • अनुवाद की निरंतरता में सुधार, खासकर जब अनुवादकों का एक समूह एक ही प्रोजेक्ट पर काम कर रहा हो।
  • अनुवादक या अनुवादकों के समूह की उत्पादकता बढ़ाकर मुनाफा बढ़ाना
  • विशेष रूप से विशिष्ट पाठों में शब्दों के अनुवाद की सटीकता और एकरूपता बढ़ाकर सेवाओं की गुणवत्ता में सुधार करना।

कमियां

  • अनुवाद को और अधिक "सूखा" बना सकते हैं; यदि अनुवाद स्मृति का उपयोग करके अनुवाद एक कम-कुशल अनुवादक द्वारा किया जाता है, तो पाठ का सार ही नष्ट हो जाता है
  • प्रोग्राम द्वारा पेश किए गए वाक्य/पाठ और पड़ोसी वाक्यों और संपूर्ण पाठ के बीच अक्सर कोई संबंध नहीं होता है।
  • मूल इलेक्ट्रॉनिक रूप में होना चाहिए
  • एक भी न पहचानी गई गलती पूरे प्रोजेक्ट में फैल सकती है
  • कार्यक्रम को स्वयं प्रशिक्षित करना आवश्यक है, और नौकरी बदलते समय - शायद एक से अधिक बार (यदि नियोक्ता विभिन्न टीएम कार्यक्रमों के साथ काम करते हैं)
  • सभी प्रकार के पाठों के लिए उपयुक्त नहीं
  • लाइसेंसशुदा सॉफ़्टवेयर की उच्च लागत

यह सभी देखें

साहित्य

  • ग्रैबोव्स्की वी.एन. ट्रांसलेशन मेमोरी टेक्नोलॉजी // ब्रिजेस। अनुवादकों का जर्नल. 2004. नंबर 2. - पी. 57-62.

लिंक

  • एक ही अनुवाद दो बार न करें // कंप्यूटर्रा ऑनलाइन, 14 फरवरी 2005।

टिप्पणियाँ


विकिमीडिया फ़ाउंडेशन. 2010.

देखें अन्य शब्दकोशों में "अनुवाद मेमोरी" क्या है:

    सामग्री 1 मनोविज्ञान में 2 इंच कंप्यूटर प्रौद्योगिकी...विकिपीडिया

    मोज़ेक चित्रण ... विकिपीडिया

    एक भाषा में पाठ के साथ उसका दूसरी भाषा में अनुवाद। "समानांतर पाठ संरेखण" एक समानांतर पाठ के दोनों हिस्सों में मेल खाने वाले वाक्यों की पहचान है। समानांतर पाठों के बड़े संग्रह को... विकिपीडिया कहा जाता है

    एक भाषा में समानांतर पाठ (बायटेक्स्ट) पाठ के साथ-साथ उसका दूसरी भाषा में अनुवाद। "समानांतर पाठ संरेखण" एक समानांतर पाठ के दोनों हिस्सों में मेल खाने वाले वाक्यों की पहचान है। बड़ी बैठकें... ...विकिपीडिया

    ट्रांसलेशन मेमोरी (टीएम, जिसे कभी-कभी "ट्रांसलेशन मेमोरी" भी कहा जाता है) एक डेटाबेस है जिसमें पहले से अनुवादित पाठों का एक सेट होता है। ऐसे डेटाबेस में एक प्रविष्टि एक खंड या "अनुवाद इकाई" (अंग्रेजी... विकिपीडिया) से मेल खाती है

वी.एन. ग्रैबोव्स्की; एक अभ्यासशील अनुवादक का जर्नल "ब्रिजेस" 2/2004

लेख एक नए अनुवादक उपकरण - ट्रांसलेशन मेमोरी (टीएम) तकनीक के बारे में बात करता है, जिसकी बदौलत अनुवाद गतिविधियों का मशीनीकरण किया जाता है।

अनुवादक के कार्य में तंत्रिका नेटवर्क

मशीनी अनुवाद सिद्धांत, जो प्राचीन काल से धीमी गति से विकसित हुए हैं, 1970 के दशक के बाद से एक बड़ा बढ़ावा मिला है। यह मॉडलिंग बौद्धिक गतिविधि के क्षेत्र में महत्वपूर्ण प्रगति के कारण था। विशुद्ध रूप से वैज्ञानिक रुचि के अलावा, इसे आधुनिक दुनिया में अंतरभाषी संचार की बढ़ती भूमिका द्वारा समझाया गया था।

इलेक्ट्रॉनिक शब्दकोशों और संवादी शब्दकोशों के अलावा, 1990 के दशक के मध्य तक, "इलेक्ट्रॉनिक अनुवादक" (उन्हें एमटी तकनीक कहा जाने लगा) काफी व्यापक हो गए। सिद्धांत रूप में, "इलेक्ट्रॉनिक अनुवादक" ऐसे प्रोग्राम हैं जो संपूर्ण पाठ को संसाधित कर सकते हैं। सच है, आउटपुट बिल्कुल वैसा नहीं था जिसकी आवश्यकता थी, और स्पष्ट रूप से, यह बिल्कुल भी नहीं था जिसकी आवश्यकता थी। एमटी तकनीक के परिणाम को वास्तव में सुसंगत पाठ बनाने के लिए, एक व्यक्ति को इस पर बहुत काम करना पड़ा।

"मशीन अनुवाद" की अवधारणा प्रसिद्ध हो गई है। घरेलू कार्यक्रम स्टाइलस (जिसे अब कहा जाता है शीघ्रऔर सुकरात). हालाँकि, प्रारंभिक जिज्ञासा की अवधि के बाद ऐसे कार्यक्रमों में रुचि धीरे-धीरे कम हो गई, और अब यह कम है, भले ही उनमें काफी सुधार हुआ है। वर्तमान में, इनका उपयोग मुख्य रूप से इंटरनेट पर विदेशी भाषा साइटों की सामग्री से परिचित होने के साथ-साथ पढ़ने और लिखने के लिए किया जाता है। ईमेलएक विदेशी भाषा में.

कुल मिलाकर, एक अनुवादक का काम सदियों से मौलिक रूप से नहीं बदला है। हाँ, कंप्यूटर दिखाई दिए, एक प्रकार के तेज़ और सुविधाजनक टाइपराइटर। हाँ, "इलेक्ट्रॉनिक अनुवादक" सामने आए हैं। हालाँकि, जबकि एमटी प्रौद्योगिकियों में सुधार हुआ है, वे अनुप्रयोगों की एक विस्तृत श्रृंखला के साथ एक उपकरण नहीं बन पाए हैं और वास्तव में समय और प्रयास बचाते हैं।

ट्रांसलेशन मेमोरी तकनीक क्या है?

प्रौद्योगिकी अनुवादकों के लिए एक नया उपकरण बन गई है अनुवाद_स्मृति(टीएम). पश्चिम में, टीएम तकनीक और इसके आधार पर बनाए गए अनुवादक उपकरण - ट्रांसलेशन मेमोरी टूल्स (टीएमटी) - प्रसिद्ध हैं और व्यापक रूप से उपयोग किए जाते हैं। इस तकनीक की एक विशेषता अनुवाद गतिविधियों का मशीनीकरण है, न कि इसका स्वचालन उस रूप में जिस रूप में एमटी तकनीक के रचनाकारों ने इसे देखा था। इसके अलावा, यह अधिक मामूली, पहली नज़र में, समाधान "इलेक्ट्रॉनिक अनुवादकों" की वैश्विक अवधारणा की तुलना में बहुत अधिक व्यावहारिक लाभ लेकर आया।

इलेक्ट्रॉनिक शब्दकोशों और अन्य अनुवादक उपकरणों से अंतर यह है कि एक विशिष्ट टीएम क्लास प्रोग्राम तंत्रिका नेटवर्क पर आधारित होता है जो कुछ हद तक काम का अनुकरण करने में सक्षम होता है। मानव मस्तिष्कडेटा संसाधित करते समय। ये नेटवर्क जटिल डेटा सेटों को सीखने और उनका विश्लेषण करने में सक्षम हैं जिन्हें रैखिक एल्गोरिदम का उपयोग करके संसाधित करना मुश्किल है।

ये प्रोग्राम न केवल उनके शब्दकोश रूपों में, बल्कि अन्य रूपों में भी, उदाहरण के लिए, किसी अन्य मामले में, शब्दों को खोजने के लिए फ़ज़ी एल्गोरिदम का उपयोग करते हैं। इसके अलावा, वे भिन्न शब्द क्रम में वाक्यांश ढूंढ सकते हैं। एक स्व-संगठित कृत्रिम तंत्रिका नेटवर्क पैटर्न खोजने और उनके बीच संबंध निर्धारित करने में सक्षम है। प्रोग्राम उस टुकड़े की तुलना करता है जिस पर आप वर्तमान में काम कर रहे हैं डेटाबेस की सामग्री के साथ और यह जानकारी डिस्प्ले पर प्रदान करता है। यह निर्धारित कर सकता है कि दिया गया टुकड़ा सिस्टम की मेमोरी में मौजूद समान टुकड़े के समान है, उदाहरण के लिए, 99%, 74%, या 20% भी।

प्रत्येक अनुवादक इस भावना से परिचित है कि जिस वाक्यांश से वह वर्तमान में संघर्ष कर रहा है वह पहले ही कहीं न कहीं, एक बार, कम से कम अनुमानित रूप में सामने आ चुका है। इसके अलावा, यह या तो उसी सामग्री में, या पहले अनुवादित किसी अन्य सामग्री में सामने आया। यह किसी प्रकार का डेजा वु है... मैं इसे देखना चाहूंगा, यह वाक्यांश, कम से कम संदर्भ के लिए, जिस पर आप अभी काम कर रहे हैं उसे समझदारी से तैयार करने के लिए...

आप मूल को पलटना शुरू करते हैं, बुकशेल्फ़ को खंगालते हैं। और अक्सर ऐसा हुआ कि खोजा गया वाक्यांश वास्तव में मिल गया। अक्सर, जब अनुवाद का काम पूरा हो चुका होता है, तब बहुत देर हो चुकी होती है। मुझे लगता है कि ऐसे क्षण में मैं एक टूल के लिए कुछ भी दूंगा जो मुझे आवश्यक पाठ ढूंढने में मदद करेगा। अब भी, जब आप किसी अनुवादित पाठ को टाइपराइटर के बजाय कंप्यूटर का उपयोग करके टाइप करते हैं, तो इतनी कठिनाई से लिखी गई किसी चीज़ को दोबारा करना हमेशा अफ़सोस की बात होती है। एक अनुवादक का लंबे समय से सपना कुछ ऐसे साधनों के साथ आना है जो उसे एक ही वाक्यांश का कई बार अनुवाद करने की आवश्यकता से मुक्त कर दें।

इस तरह का विचार ट्रांसलेशन मेमोरी तकनीक, या बस टीएम के निर्माण का आधार है, जिसके आधार पर 80 के दशक के अंत में - 90 के दशक की शुरुआत में कम या ज्यादा व्यावहारिक कार्यक्रम सामने आने लगे। वास्तव में, ऐसा प्रोग्राम एक नियंत्रण शेल है जो एक या दूसरे प्लग-इन डेटाबेस (टीएम) के साथ काम करता है और जिसे मैं अनुवाद बैंक कहूंगा। टीएम एक बड़े फाइलिंग कैबिनेट का कम्प्यूटरीकृत संस्करण है जिसमें आपके द्वारा अनुवादित प्रत्येक वाक्यांश को जोड़े में संग्रहीत किया जाता है - मूल भाषा और लक्ष्य भाषा दोनों में। ऐसे प्रत्येक जोड़े को द्विभाषी कहा जाता है। कार्यक्रम आपको तुरंत याद दिलाएगा कि पिछली बार इस वाक्यांश का अनुवाद कैसे किया गया था। सूचना तक पहुँच आसान और तेज़ है।

ट्रांसलेशन मेमोरी क्लास के मुख्य कार्यक्रमों का अवलोकन

वर्तमान में, विश्व बाज़ार में टीएम प्रौद्योगिकी का उपयोग करने वाले कई सॉफ़्टवेयर उत्पाद मौजूद हैं। वे एक-दूसरे से भिन्न होते हैं, और कभी-कभी महत्वपूर्ण रूप से भी। हालाँकि, उन सभी में कुछ समानताएँ हैं कार्यक्षमता.

उदाहरण के लिए, उनके पास आमतौर पर दो समानांतर विंडो वाला एक टेक्स्ट एडिटर होता है। एक विंडो मूल पाठ के लिए है, दूसरी अनुवाद के लिए। जब मूल पाठ का टुकड़ा मूल विंडो में प्रदर्शित होता है (यह एक वाक्य, एक पैराग्राफ, एक शब्द हो सकता है), तो डेटाबेस में एक समान टुकड़े की खोज शुरू होती है। यदि स्मृति में बिल्कुल वही टुकड़ा है, तो यह अनुवाद विंडो में स्वचालित रूप से प्रदर्शित होता है। यदि बिल्कुल वही टुकड़ा नहीं मिला, लेकिन कुछ समान पाया गया, तो पाया गया टुकड़ा प्रोग्राम विंडो में प्रदर्शित होता है, जो मिलान का प्रतिशत दर्शाता है।

अनुवादक प्रोग्राम द्वारा प्रस्तावित अनुवाद पाठ को संपादित करता है, इसे मूल के अनुरूप लाता है, इसे डेटाबेस मेमोरी में भेजता है और अगले पर आगे बढ़ता है। यदि कुछ भी नहीं मिलता है, तो अनुवादक अनुवाद विंडो में पाठ टाइप करके इसे शुरू से अनुवाद करता है। इस टुकड़े पर काम पूरा करने के बाद, अनुवादक इसे डेटाबेस मेमोरी में भेजता है और अगले पर आगे बढ़ता है। इस प्रकार, जैसे-जैसे काम आगे बढ़ता है, टीएम पुनःपूर्ति स्वचालित रूप से होती है। द्विभाषी के टीएम में प्रवेश करने के तुरंत बाद, यह उपयोगकर्ता के लिए उपलब्ध हो जाता है। यदि टीएम प्रोग्राम चालू है नेटवर्क ड्राइवऔर अन्य उपयोगकर्ता इसके साथ काम करते हैं, तो नया द्विभाषी तुरंत अन्य अनुवादकों के लिए उपलब्ध हो जाता है। मूल खंड और अनुवादित खंड को डेटाबेस में भेजे जाने के बाद, अगला खंड मूल विंडो में प्रदर्शित होता है।

इस प्रकार का पहला प्रोग्राम, जिसे ट्रांसलेशन मैनेजर कहा जाता है, आईबीएम द्वारा विकसित किया गया था। प्रारंभ में, आईबीएम ने अनुवाद प्रबंधक का उपयोग अपनी जरूरतों के लिए किया - स्थानीयकरण (अनुकूलन) के लिए विदेशी भाषाएँ) अपना सॉफ़्टवेयर. अनुवाद प्रबंधक को तब एक व्यावसायिक उत्पाद के रूप में बाज़ार में पेश किया गया था और कुछ समय तक इस क्षेत्र में उसका एकाधिकार था। यह प्रोग्राम उपयोग में काफी आसान, तेज़ है और व्यक्तिगत उपयोगकर्ता सेटिंग्स के लिए अच्छे अवसर प्रदान करता है। तीन मुख्य कार्यों में से प्रत्येक के लिए अलग-अलग विंडो हैं - अनुवाद, अनुवाद मेमोरी और शब्दकोश। ट्रांसलेशन मेमोरी विंडो मेमोरी में पाए गए मिलान, यदि कोई हो, प्रदर्शित करती है, और डिक्शनरी विंडो आईबीएम द्वारा विकसित शब्दकोशों से शब्दावली प्रदर्शित करती है। इस प्रोग्राम में कुछ असुविधाएँ भी हैं, उदाहरण के लिए, अनुवाद मेमोरी में अलग-अलग शब्दों को खोजने की एक जटिल प्रक्रिया।

एक अन्य कार्यक्रम - एसडीएलएक्स - एक अंग्रेजी कंपनी द्वारा अपनी जरूरतों के लिए विकसित किया गया था एसडीएल, सॉफ्टवेयर स्थानीयकरण में लगे हुए हैं। किट में शामिल प्रत्येक प्रोग्राम अलग से स्थापित किया गया है। एसडीएल एडिट, वास्तव में, प्रोग्राम ही है जिसके साथ अनुवाद किया जाता है। इसमें स्रोत पाठ, अनुवाद और अनुवाद मेमोरी दिखाने वाली तीन विंडो हैं। यह ध्यान दिया जाना चाहिए कि अनुवादित किए जाने वाले दस्तावेज़ को सीधे एसडीएल एडिट में आयात नहीं किया जा सकता है। इसे पहले एसडीएल कन्वर्ट का उपयोग करके परिवर्तित किया जाना चाहिए, जो एक निश्चित असुविधा है।

कार्यक्रम देजा वुअपने लचीलेपन और अनुकूलनशीलता के कारण यूरोप में अनुवादकों के बीच लोकप्रिय है। सुविधा के अलावा, डेजा वू उच्चतम मूल्य/गुणवत्ता अनुपात में अन्य उत्पादों से भिन्न है। पिछले दो कार्यक्रमों की तुलना में, विचाराधीन उत्पाद में कई सुविधाजनक सुविधाएँ हैं। विशेषज्ञों का कहना है कि शुरू से ही यह कार्यक्रम इसके भावी उपयोगकर्ताओं के संपर्क में विकसित किया गया था। यह ज्ञात है कि डेजा वु के नवीनतम संस्करण का परीक्षण, विशेष रूप से, रूसी अनुवादकों द्वारा किया गया था। उनमें से एक, एंड्री गेरासिमोव ने मल्टीलिंगुअल कंप्यूटिंग एंड टेक्नोलॉजी पत्रिका में इस कार्यक्रम की सकारात्मक समीक्षा लिखी।

यह कार्यक्रम हमारे देश में प्रसिद्ध है और यूरोप में लोकप्रिय है। स्टार पारगमन. अपनी विचारधारा में यह संबंधित वर्ग के अन्य उत्पादों से बिल्कुल अलग है। आपको उनके बारे में पहले से ही कुछ जानकारी है, और आप जानते हैं कि उन सभी के पास एक केंद्रीय डेटाबेस है बड़ी क्षमता, अनुवादों का एक संग्रह जिसमें आवश्यक डेटा तुरंत मिल जाता है (यदि वह मौजूद है, तो निश्चित रूप से)। जैसा कि बिल गेट्स कहेंगे: "जानकारी आपकी उंगलियों पर।" तो, सभी ट्रांसलेशन मेमोरी प्रोग्राम में एक इलेक्ट्रॉनिक कैटलॉग कैबिनेट होता है, लेकिन ट्रांज़िट में नहीं होता है। उसके साथ सब कुछ अलग है. स्रोत डेटा और अनुवाद को पाठ प्रारूप में फ़ाइलों के रूप में सहेजा जाता है, जिसे अनुवादक अपने विवेक पर निर्देशिकाओं में रखता है। इसके बाद अनुवादक प्रोग्राम को आसानी से बता सकता है कि उसे कौन सी निर्देशिकाएँ और यहाँ तक कि कौन सी फ़ाइलें चाहिए। ट्रांज़िट फिर लिंक का एक सहयोगी नेटवर्क बनाता है, जिसके साथ यह काम करता है। कुछ फायदों के बावजूद, रूस में ट्रांज़िट का व्यापक रूप से उपयोग नहीं किया जाता है। अंततः, ट्रांज़िट के आधिकारिक वितरक, प्रॉम्ट ने ट्रेडोस ट्रांसलेटर के वर्कबेंच को वितरित करना शुरू कर दिया।

लेकिन अनुवादक का कार्यक्षेत्र, या बस ट्रेडोस, रूस में तेजी से व्यापक हो गया, पहले अनुवाद फर्मों के बीच, और फिर व्यक्तिगत अनुवादकों के बीच। इसे संभवतः इस तथ्य से समझाया जा सकता है कि यह वर्ड को छोड़े बिना काम करना संभव बनाता है, जो मनोवैज्ञानिक रूप से अधिक आरामदायक है। सभी प्रकार के कोड वाले टेक्स्ट को देखना किसे पसंद है? वर्ग कोष्ठक? अनुवादक का कार्यक्षेत्र (ट्रेडोस), अन्य कार्यक्रमों की तुलना में, एक सामान्य अनुवादक के लिए अधिक सुविधाजनक है जो प्रोग्रामिंग विशेषज्ञ नहीं है; यह इस प्रकार के अन्य कार्यक्रमों की तुलना में अधिक समझने योग्य है। विशेष रूप से, नियंत्रण बटन टूलटिप्स से सुसज्जित हैं। एक परिचित और समझने योग्य शब्द में होने के कारण, आप इसके सभी टूल (उदाहरण के लिए, ऑटोटेक्स्ट) का उपयोग कर सकते हैं।

इस उत्पाद में है पूरा स्थिरउपयोगी उपकरण जो अन्य प्रोग्रामों में किसी न किसी स्तर तक ही मौजूद होते हैं। इनमें से एक उपकरण एनालाइज़ है, जो आपको मूल पाठ का पहले से विश्लेषण करने और यह पता लगाने की अनुमति देता है कि क्या पूर्ण और अपूर्ण मिलान हैं (और कितनी मात्रा में)। यह बात बताने लायक है उपयोगी उपकरण, प्लेसएबल्स की तरह, जो, उदाहरण के लिए, पाठ में संख्याओं को स्वचालित रूप से बदलने की अनुमति देता है यदि अनुवादित टुकड़े में बाकी सब कुछ अनुवाद बैंक (टीएम) में पाए गए से मेल खाता है। बहुत सुविधाजनक स्वचालित कार्यसंख्याओं, समय प्रारूपों, संक्षिप्ताक्षरों आदि में दशमलव बिंदुओं और/या अल्पविरामों को बदलना। अनुवादक द्वारा निर्दिष्ट उचित मापदंडों के लिए।

टीएम प्रौद्योगिकी का उपयोग करने वाले अधिकांश रूसी अनुवादक अनुवादक के कार्यक्षेत्र (ट्रेडोस) को पसंद करते हैं।

ट्रांसलेशन मेमोरी प्रोग्राम में क्या समानता है?

ट्रांसलेशन मेमोरी वर्ग के मुख्य सॉफ़्टवेयर उत्पादों के विवरण को सारांशित करते हुए, यह ध्यान दिया जाना चाहिए कि, एक नियम के रूप में, उनमें कई सामान्य कार्यक्षमताएँ हैं।

मिश्रण - संरेखण

यह फ़ंक्शन आपको ट्रांसफर बैंक (टीएम) बनाने की अनुमति देता है मौजूदा फ़ाइलें. दो फ़ाइलों से - एक मूल पाठ के साथ और दूसरा अनुवादित पाठ के साथ - द्विभाषी का एक सेट बनाया जाता है। स्रोत पाठ के वाक्य के विपरीत उसका अनुवाद निर्मित होता है। और इसी तरह उन सभी फ़ाइलों के लिए जिन्हें अनुवादक ने एक संग्रह में संकलित किया है। संयोजन फ़ंक्शन की सुविधा की डिग्री विभिन्न कार्यक्रमविभिन्न।

रखरखाव

जैसे-जैसे डेटाबेस में द्विभाषी जमा होते जाएंगे, उनकी संख्या इतनी बढ़ सकती है कि डेटाबेस की सामग्री सभी सीमाओं से परे जा सकती है। कुछ अशुद्धियाँ और यहाँ तक कि त्रुटियाँ भी दिखाई दे सकती हैं, खासकर यदि प्रोग्राम का उपयोग नेटवर्क पर कई उपयोगकर्ताओं द्वारा किया जाता है। किसी चीज़ को संपादित करने या स्पष्ट करने या यहां तक ​​कि उसे हटाने की भी आवश्यकता होगी। निष्पक्षता के लिए, यह कहा जाना चाहिए कि उल्लिखित कार्यक्रम रखरखाव उपकरण इस समस्या को पूरी तरह से हल नहीं करता है - व्यवहार में अनुवाद बैंकों की रुकावट से निपटना अभी भी मुश्किल है।

शब्दावली शब्दकोश - शब्दावली कार्यक्रम

विचाराधीन सभी कार्यक्रमों के अपने-अपने शब्दावली शब्दकोश हैं, जो अनिवार्य रूप से सभी को ज्ञात इलेक्ट्रॉनिक शब्दकोश हैं। शब्दावली शब्दकोश फ़ाइलें शब्दकोश या शब्दावली प्रारूप में आयात कर सकते हैं; उन्हें मैन्युअल रूप से भी अद्यतन किया जा सकता है।

पाठ संपादक - दस्तावेज़ संपादक

यहीं पर अनुवाद प्रक्रिया वास्तव में होती है। इस प्रयोजन के लिए, सभी कार्यक्रमों में ऊपर उल्लिखित दो विंडो होती हैं - स्रोत पाठ के लिए और उसके अनुवाद के लिए। सभी पाठ संपादकों में जो अनुवाद किया जा रहा है उसके बीच समानता का प्रतिशत निर्धारित करने की क्षमता होती है इस पलस्रोत पाठ और अनुवाद पुस्तकालय में पाठ। आप समानता प्रतिशत जितना अधिक, जैसे 90% या 95%, सेट करेंगे, वहां मेल खाने वाला टेक्स्ट मिलने की संभावना उतनी ही कम होगी। हालाँकि, आप एक छोटा प्रतिशत निर्धारित कर सकते हैं, फिर आप बहुत सारी सामग्री जमा कर सकते हैं जो कम से कम संदर्भ के लिए उपयोगी होगी।

कॉनकॉर्डेंस (संदर्भ के साथ शब्द प्रयोग को जोड़ना) - कॉनकॉर्डेंस

यह विचाराधीन सभी कार्यक्रमों की एक बहुत ही उपयोगी विशेषता है। अक्सर ऐसा होता है कि एक शब्द (या शब्दों के संयोजन) के कई अर्थ या अर्थ के शेड्स हो सकते हैं। एक शब्द का चयन करके, आप विंडो में संग्रह के सभी द्विभाषी और विभिन्न संदर्भों में देख सकते हैं। इससे किसी दिए गए शब्द या संयोजन का सबसे सटीक अनुवाद चुनना हमेशा आसान हो जाता है।

एनरस एजेंसी के निदेशक नताल्या शाखोवा का मानना ​​है कि अधिकांश टीएम उत्पाद उपयोगकर्ता को विभिन्न वर्ड प्रोसेसर से परिचित होने की आवश्यकता से छुटकारा दिलाते हैं। यह सुविधाओं का अध्ययन करने के लिए पर्याप्त है पाठ संपादकउत्पाद स्वयं, और आप सभी प्रकार के टेक्स्ट को नियंत्रित करने में सक्षम होंगे, चाहे वे क्वार्कएक्सप्रेस, फ़्रेममेकर या एडोब इलस्ट्रेटर में प्रस्तुत किए गए हों। बेशक, यहां कुछ मुश्किलें हैं: अगले में महारत हासिल करने के लिए शब्द संसाधकया प्रकाशन प्रणाली, आपको संबंधित फ़िल्टर प्रोग्राम की आवश्यकता होगी - क्या? यह सही है - यह कुछ पैसे के लिए बिकता है! सामान्य तौर पर, जब टीएमटी की बात आती है तो पैसे का मुद्दा सबसे गंभीर होता है। वे सस्ते नहीं हैं (आमतौर पर कई सौ डॉलर), और, ज़ाहिर है, कोई अनुकूलता नहीं है। इसलिए, यदि आपने एक परियोजना के लिए एक उत्पाद खरीदा (और उसमें महारत हासिल की!), तो अगले के लिए आपको एक और उत्पाद खरीदने और उसे फिर से सीखने में समय बिताने की आवश्यकता हो सकती है।

नतालिया शखोवा आगे कहती हैं कि पश्चिम पहले से ही ऐसे कार्यक्रमों के व्यापक प्रसार के परिणामों पर सक्रिय रूप से चर्चा कर रहा है। उनमें से एक यह है कि एक नया अनुवादक बाज़ार में प्रवेश करने का अवसर खो देता है। जिस तरह रूस में एक अनुवादक के लिए कंप्यूटर और प्रिंटर न होने पर ऑर्डर प्राप्त करना पहले से ही बहुत मुश्किल है, उसी तरह विदेशों में उन अनुवादकों के लिए रोजगार की समस्याएँ हैं जिनके पास टीएम प्रोग्राम नहीं है। इस घटना का एक सकारात्मक पक्ष भी है - टीएम प्रोग्राम के मालिक को काम पर रखने से, ग्राहक को उसकी व्यावसायिकता की कुछ गारंटी मिलती है। लेकिन शुरुआती लोगों को भी शुरुआत करने का अवसर मिलना चाहिए!

हमारे देश में ट्रांसलेशन मेमोरी तकनीक के प्रति दृष्टिकोण अलग-अलग हैं।

जब अनुवाद एजेंसी फोनेटिक्स ने 1999 में ट्रेडोस ट्रांसलेटर के वर्कबेंच के साथ काम करना शुरू किया, तो स्वाभाविक रूप से, ग्राहकों के साथ संपर्क के दौरान, हमने परिवर्तन के बारे में बात की। नई टेक्नोलॉजी. अपेक्षाओं के विपरीत, प्रतिक्रिया सतर्क और कभी-कभी सर्वथा नकारात्मक थी। यह पता चला कि मशीनी अनुवाद का विचार 90 के दशक में स्टाइलस और सुकरात जैसे कार्यक्रमों के विचारहीन उपयोग से पहले ही समझौता कर लिया गया था। इसके अलावा, उनका उपयोग अक्सर अनुवादकों द्वारा किया जाता था, कहते हैं, बहुत अधिक योग्य नहीं, जो "इलेक्ट्रॉनिक अनुवादकों" द्वारा उत्पादित सामग्री को संपादित करने की जहमत नहीं उठाते थे। हालाँकि, इन कार्यक्रमों के उपयोगकर्ताओं को यह भी समझा जा सकता है - इन ग्रंथों को संपादित करने में बहुत समय और प्रयास की आवश्यकता होती है।

अब भी, आप कभी-कभी रूसी संगठनों के ग्राहकों को अनुवाद सॉफ़्टवेयर के क्षेत्र में किसी भी नवाचार के प्रति सतर्क रवैया दिखाते हुए पा सकते हैं। वहीं, इसके विपरीत, विदेशी कंपनियों को ट्रांसलेशन मेमोरी क्लास प्रोग्राम के उपयोग की आवश्यकता होती है। उनकी अक्सर स्थापित प्राथमिकताएँ होती हैं, मुख्य रूप से ट्रेडोस ट्रांसलेटर का कार्यक्षेत्र, साथ ही स्टार ट्रांज़िट। उनके पास अक्सर तैयार टीएम (अनुवाद बैंक) होते हैं जिन्हें वे उपयोग करने की पेशकश करते हैं।

जहां तक ​​अनुवादकों का सवाल है, अनुवाद मेमोरी तकनीक में उनकी रुचि समझने योग्य है। अनुवाद एजेंसियाँ उनमें और भी अधिक रुचि रखती हैं। वे कथा साहित्य, पत्रकारिता, कविता आदि से ज्यादा नहीं निपटते, बल्कि संचालन निर्देश, समस्या निवारण गाइड और सॉफ्टवेयर स्थानीयकरण से निपटते हैं, यानी। उन सामग्रियों के साथ जहां पाठ के दोहराए गए या समान टुकड़े हैं।

ऐसा प्रतीत होता है कि अपने वर्तमान स्वरूप में, ट्रांसलेशन मेमोरी प्रोग्राम अपनी चरम सीमा पर पहुंच गए हैं। उनके परिशोधन पर आगे का काम उनकी मौजूदा कार्यक्षमता में सुधार के मार्ग पर चलता है। इससे यह तथ्य सामने आता है कि कार्यक्रम अधिक से अधिक बोझिल और जटिल होते जा रहे हैं, और यह इस तथ्य के बावजूद है कि वहां कोई मौलिक रूप से नए विचार नहीं हैं। इसमें वही अनुवादक का कार्यक्षेत्र (ट्रेडोस) है नवीनतम संस्करणउपकरणों का एक ऐसा सेट हासिल किया जो एक साधारण उपयोगकर्ता के लिएउन्हें समझना बहुत मुश्किल है.

इस कार्यक्रम के संचालन के लिए अनुवाद एजेंसी के कर्मचारियों में एक अलग कर्मचारी की उपस्थिति की आवश्यकता होती है। उपयोगकर्ता मैनुअल के अलावा, दस्तावेज़ में एक TRADOS विशेषज्ञ मार्गदर्शिका भी शामिल है। इसके अलावा, दस्तावेज़ीकरण पैकेज में एक प्रोजेक्ट प्रबंधन गाइड, मल्टीटर्म उपयोगकर्ता गाइड और WinAlign उपयोगकर्ता गाइड शामिल हैं। यहां तक ​​कि एक प्रशिक्षित अनुवादक को भी इन दस्तावेज़ों के सैकड़ों पृष्ठों की समीक्षा करने के लिए बहुत प्रयास और समय की आवश्यकता होगी।

कृत्रिम बुद्धिमत्ता और मशीनी अनुवाद के क्षेत्र में जाने-माने विशेषज्ञ प्रोफेसर एस. निरेनबर्ग के नेतृत्व में मैरीलैंड विश्वविद्यालय, बाल्टीमोर काउंटी (यूएसए) के शोधकर्ताओं का एक समूह नए समाधान खोज रहा है। अब तक, विकास सैद्धांतिक अनुसंधान के चरण में है, और सबसे अधिक संभावना है, इस शोध को व्यावसायिक उत्पाद के चरण में लाने में काफी समय लगेगा।

गौरतलब है कि अनुवादक उपकरणों के बाजार पर मुख्य रूप से विदेशी कंपनियों का कब्जा है। मैं आशा करना चाहूंगा कि यह हमेशा के लिए नहीं चलेगा। सिमेंटिक विश्लेषण के क्षेत्र में रूसी विशेषज्ञों द्वारा सैद्धांतिक विकास की संभावना बहुत बड़ी है। इस क्षेत्र में हमारा शोध बहुत ऊंचे स्तर पर पहुंच गया है। यह उम्मीद करने का हर कारण है कि ये विकास मौलिक रूप से नई भाषाई प्रौद्योगिकियों के रूप में साकार होंगे जो अनुवादक की रचनात्मक क्षमता को पूरी तरह से उजागर करेंगे।

एक अभ्यासशील अनुवादक का जर्नल"ब्रिजेज़", अनुवादकों के लिए कुछ पेशेवर पत्रिकाओं में से एक। पत्रिका विभिन्न विशिष्टताओं के अनुवादकों के लेख प्रकाशित करती है, मौखिक और लिखित दोनों। पत्रिका के पन्नों पर ज्ञान के विभिन्न क्षेत्रों में विशेषज्ञता रखने वाले अनुवादकों को चर्चा करने का अवसर मिलता है वास्तविक समस्याएँ, एक दूसरे के साथ बहस करें, पेशेवर उत्कृष्टता के रहस्यों को साझा करें।

अनुवाद स्मृति

ट्रांसलेशन मेमोरी (टीएम, जिसे कभी-कभी "ट्रांसलेशन मेमोरी" भी कहा जाता है) एक डेटाबेस है जिसमें पहले से अनुवादित पाठों का एक सेट होता है। ऐसे डेटाबेस में एक प्रविष्टि एक "अनुवाद इकाई" से मेल खाती है, जिसे आम तौर पर एक वाक्य (शायद ही कभी, एक जटिल वाक्य का हिस्सा, या एक पैराग्राफ) के रूप में लिया जाता है। यदि स्रोत पाठ का अगला वाक्य डेटाबेस में संग्रहीत वाक्य से बिल्कुल मेल खाता है (सटीक मिलान), तो इसे स्वचालित रूप से अनुवाद में प्रतिस्थापित किया जा सकता है। नया ऑफ़र डेटाबेस में संग्रहीत (फ़ज़ी मैच) से थोड़ा भिन्न भी हो सकता है। ऐसा वाक्य अनुवाद में भी डाला जा सकता है, लेकिन अनुवादक को आवश्यक परिवर्तन करने होंगे।

दोहराए गए अंशों की अनुवाद प्रक्रिया को तेज करने और पहले से अनुवादित पाठों में किए गए परिवर्तनों (उदाहरण के लिए, सॉफ़्टवेयर उत्पादों के नए संस्करण या कानून में परिवर्तन) के अलावा, अनुवाद मेमोरी सिस्टम समान अंशों में शब्दावली के अनुवाद में एकरूपता भी सुनिश्चित करते हैं, जो तकनीकी अनुवाद में विशेष रूप से महत्वपूर्ण है। दूसरी ओर, यदि कोई अनुवादक नियमित रूप से अनुवाद डेटाबेस से निकाले गए सटीक मिलान को नए संदर्भ में उनके उपयोग की निगरानी किए बिना अपने अनुवाद में प्रतिस्थापित करता है, तो अनुवादित पाठ की गुणवत्ता खराब हो सकती है।

प्रत्येक विशिष्ट ट्रांसलेशन मेमोरी सिस्टम अपने स्वयं के प्रारूप में डेटा संग्रहीत करता है (वर्डफ़ास्ट में टेक्स्ट प्रारूप, डेजा वू में एक्सेस डेटाबेस), लेकिन एक अंतरराष्ट्रीय मानक टीएमएक्स (ट्रांसलेशन मेमोरी ईएक्सचेंज प्रारूप) है, जो एक्सएमएल पर आधारित है और जिसे लगभग द्वारा उत्पन्न किया जा सकता है हर कोई पीपी सिस्टम। इसके लिए धन्यवाद, अनुवादकों के काम के परिणामों को अनुप्रयोगों के बीच आदान-प्रदान किया जा सकता है, यानी, ओमेगाटी के साथ काम करने वाला अनुवादक TRADOS में बनाई गई अनुवाद मेमोरी का उपयोग कर सकता है और इसके विपरीत।

अधिकांश अनुवाद मेमोरी प्रणालियाँ कम से कम उपयोगकर्ता शब्दकोशों के निर्माण और उपयोग, समानांतर पाठों (अंग्रेजी संरेखण) के आधार पर नए डेटाबेस के निर्माण, साथ ही मूल और समानांतर पाठों से शब्दावली के अर्ध-स्वचालित निष्कर्षण का समर्थन करती हैं।

अनुवाद मेमोरी सॉफ्टवेयर सिस्टम की सूची

सिस्टम उपयोग की हालिया समीक्षाओं के अनुसार अनुवाद स्मृतिसबसे लोकप्रिय प्रणालियों में शामिल हैं।

टीएम एक डेटाबेस है जहां पूर्ण किए गए अनुवाद संग्रहीत किए जाते हैं। टीएम तकनीक संचय के सिद्धांत पर काम करती है: टीएम में अनुवाद की प्रक्रिया में, मूल खंड (वाक्य) और उसका अनुवाद सहेजा जाता है। अनुवाद के लिए प्राप्त नए पाठ को संसाधित करते समय, सिस्टम प्रत्येक वाक्य की तुलना डेटाबेस में संग्रहीत खंडों से करता है। यदि मूल के समान या समान खंड पाया जाता है, तो उस खंड का अनुवाद अनुवाद और प्रतिशत मिलान के संकेत के साथ प्रदर्शित किया जाता है। सहेजे गए पाठ से भिन्न शब्दों और वाक्यांशों को हाइलाइट किया जाता है। इस प्रकार, अनुवादक को केवल नए खंडों का अनुवाद करना होगा और आंशिक रूप से मेल खाने वाले खंडों को संपादित करना होगा। प्रत्येक परिवर्तन या नया अनुवाद टीएम में सहेजा जाता है। परिणामस्वरूप, एक ही वाक्य का दो बार अनुवाद करने की आवश्यकता नहीं है।

दूसरी ओर, जब साथ काम करते हैं बड़ी परियोजनाएँअनुवादक को एक लंबी परियोजना के दौरान लगातार शब्दावली शब्दावली लागू करने या पहले से अनुवादित पाठ को तुरंत पुन: उपयोग करने की समस्या का सामना करना पड़ता है। प्रकृति में समान नित्य के कामऔपचारिक रूप देना और प्रोग्राम करना अपेक्षाकृत आसान है (मशीन अनुवाद के विपरीत)।

प्रत्येक टीएम डेटाबेस रिकॉर्ड समानांतर पाठों (आमतौर पर दो भाषाओं में) की एक इकाई (वाक्य या पैराग्राफ) का प्रतिनिधित्व करता है। ऐसा डेटाबेस पिछले अनुवादों को उनके संभावित पुन: उपयोग और सामग्री के माध्यम से त्वरित खोज की समस्याओं को हल करने के उद्देश्य से संग्रहीत करता है। इस तथ्य के बावजूद कि अनुवाद मेमोरी से लैस प्रोग्राम को कंप्यूटर-एडेड/असिस्टेड ट्रांसलेशन सिस्टम (सीएटी) कहा जाता है, उन्हें मशीनी अनुवाद प्रोग्राम के साथ भ्रमित नहीं किया जाना चाहिए - अनुवाद मेमोरी अपने आप में कुछ भी अनुवाद नहीं करती है, जबकि मशीनी अनुवाद कैसे उत्पन्न करने पर आधारित है स्रोत पाठ के व्याकरणिक विश्लेषण के परिणामों के आधार पर अनुवाद।

एक नियम के रूप में, एक अनुवाद मेमोरी रिकॉर्ड में दो खंड होते हैं: स्रोत (स्रोत) और लक्ष्य (लक्ष्य) भाषाओं में। यदि स्रोत भाषा में एक समान (या समान) खंड पाठ में होता है, तो लक्ष्य भाषा में खंड अनुवाद स्मृति में पाया जाएगा और अनुवादक को नए अनुवाद के आधार के रूप में पेश किया जाएगा। स्वचालित रूप से पाए गए पाठ को वैसे ही उपयोग किया जा सकता है, संपादित किया जा सकता है या पूरी तरह से अस्वीकार किया जा सकता है। अधिकांश प्रोग्राम फ़ज़ी मिलान एल्गोरिदम का उपयोग करते हैं, जो उनकी कार्यक्षमता में काफी सुधार करता है, क्योंकि इस मामले में ऐसे वाक्य ढूंढना संभव है जो केवल खोज वाक्यांशों की याद दिलाते हैं, लेकिन फिर भी, बाद के संपादन के लिए उपयुक्त हैं।

ऐसे सॉफ़्टवेयर का उपयोग करने के लाभ पहले स्पष्ट नहीं हो सकते हैं - हालाँकि, जैसे-जैसे डेटाबेस भर जाता है, अनुवाद आधारों के स्वचालित प्रतिस्थापन के परिणाम अधिक सटीक और नियमित हो जाएंगे।

स्वचालित प्रणाली की वास्तुकला और इसकी कार्यक्षमता भिन्न हो सकती है। खोज उपकरण संपूर्ण खंडों या अलग-अलग शब्दों या वाक्यांशों के साथ काम कर सकते हैं, जिससे अनुवादक को शब्दावली खोज करने की अनुमति मिलती है। सिस्टम भी शामिल है अलग कार्यक्रमपरियोजना में उपयोग के लिए स्वीकृत शर्तों वाली शब्दावली के साथ काम करना। कुछ प्रणालियाँ मशीनी अनुवाद कार्यक्रमों के साथ काम करती हैं। मुख्य ऑपरेटिंग इंटरफ़ेस या तो सीधे मौजूदा वर्ड प्रोसेसर, जैसे वर्ड, में एकीकृत होता है, या एक अलग संपादक होता है। सिस्टम में आवश्यक रूप से विभिन्न प्रारूपों की फ़ाइलों को आयात और निर्यात करने के लिए फ़िल्टर शामिल हैं। इसके अलावा, यदि सभी नहीं तो कई प्रणालियों में अनुवादक की पुरानी अनुवादित फ़ाइलों से अनुवाद मेमोरी में खंड जोड़ने की सुविधा होती है।

जो बात भाषा सीखने की अवधारणा पर लागू होती है वह अनुवाद स्मृतियों पर भी लागू होती है।

"खाली" प्रणाली शब्दों और वाक्यों को याद रखती है।

एक "ट्रांसलेशन मेमोरी" बनाई गई है - ट्रांसलेशन मेमोरी (टीएम)।

टीएम किसी उत्पाद के लिए या समग्र रूप से कंपनी की गतिविधियों के लिए "भाषाई स्मृति" बन जाता है।

TM सिस्टम: SDLX, TRADOS, Deja Vu, Star Transit, Trans Suite 2000, WordFast, WordFisher, ACROSS।

संयुक्त प्रणाली

एमपी और टीएम प्रौद्योगिकियां एक-दूसरे की पूरक हैं, लेकिन एक-दूसरे की नकल नहीं करतीं। एमपी सिस्टम इंस्टॉलेशन के तुरंत बाद उपयोग के लिए तैयार है (हालांकि यह इस संभावना को बाहर नहीं करता है कि ऑपरेशन के दौरान उपयोगकर्ता शब्दकोश, अनुवाद एल्गोरिदम इत्यादि में कुछ बदलना चाहेगा)। किसी विशिष्ट क्षेत्र में पाठों का अनुवाद करने के लिए टीएम प्रणाली को विशेष रूप से कॉन्फ़िगर किया जाना चाहिए, और ये पाठ एक-दूसरे के जितने अधिक समान होंगे (उदाहरण के लिए, ऐसी प्रणाली का उपयोग मानक अनुबंधों का अनुवाद करने के लिए किया जाता है), कॉन्फ़िगरेशन के लिए उतना ही कम समय की आवश्यकता होती है।

इस संबंध में, हाइब्रिड के उद्भव के लिए यह पूरी तरह से तर्कसंगत है - उदाहरण-आधारित मशीन अनुवाद - प्रोग्राम जो मशीन अनुवाद और टीएम सिस्टम को जोड़ते हैं (उदाहरण के लिए, PROMT कंपनी ने TRADOS के लिए एक एकीकृत तकनीक PROMT टर्म और PROMT बनाई है, जो जोड़ती है TM TRADOS सिस्टम और मशीनी अनुवाद प्रणाली - PROMT XT प्रोफेशनल)। PROMT For TRADOS (P4T) को PROMT मशीन अनुवाद प्रणाली और TM TRADOS प्रणाली को एकीकृत करने के लिए डिज़ाइन किया गया है:

TRADOS प्रणाली में अनुवाद;

टीएम में नहीं मिले खंडों का PROMT प्रणाली में अनुवाद;

अनुवादित PROMT खंडों को TM में सम्मिलित करना।

एकीकृत PROMT-TRADOS प्रौद्योगिकी पर आधारित एक स्वचालित स्थानांतरण श्रृंखला की योजना

एकीकृत प्रौद्योगिकी का उपयोग बड़ी मात्रा में दस्तावेज़ों के अनुवाद की प्रक्रिया को प्रबंधनीय बनाता है और इसकी आर्थिक दक्षता को बढ़ाता है।

एकीकृत PROMT-TRADOS प्रौद्योगिकी का उपयोग करके परियोजना कार्यान्वयन का एक उदाहरण।

मान लीजिए आपको मिनी-पीबीएक्स के लिए निर्देशों का अनुवाद करने की आवश्यकता है।

1. पहले चरण में PROMT टर्म प्रोग्राम का उपयोग किया जाता है। दस्तावेज़ों का विश्लेषण किया जाता है और बुनियादी शब्दावली की पहचान की जाती है, जिसे PROMT मशीन अनुवाद प्रणाली के शब्दकोशों में दर्ज किया जाता है।

2. मशीनी अनुवाद (एमटी) एक कनेक्टेड शब्दकोश के साथ किया जाता है, शब्दकोश को सही करने के लिए शब्दावली संबंधी कार्य जारी रहता है।

3. अनुवाद प्रक्रिया के परिणामों को सही किया जाता है और अनुवादित दस्तावेज़ के टीएम में दर्ज किया जाता है।

4. इस प्रकार उपयोगकर्ता को प्राप्त होता है:

शब्दावली शब्दकोश;

अनुवादित दस्तावेज़;

अनुवादित दस्तावेज़ के अनुरूप टीएम, जिसका उपयोग इस प्रकार के दस्तावेज़ों के साथ आगे के काम में किया जा सकता है।

स्वचालित डिज़ाइन सिस्टम

सीएडी एक सॉफ्टवेयर है जिसे ड्राइंग, डिज़ाइन और तकनीकी दस्तावेज़ीकरण के साथ-साथ 3डी मॉडल बनाने के लिए डिज़ाइन किया गया है। में यह सूचीसबसे आम CAx प्रोग्राम (CAD, CAM, CAE) शामिल हैं।

जब स्वचालित अनुवाद के बारे में बात की जाती है, तो हमारा मतलब आमतौर पर ऐसे प्रोग्राम से होता है जो मशीन अनुवाद तकनीक (मशीन अनुवाद) के आधार पर अनुवाद करते हैं। हालाँकि, एक और तकनीक है - ट्रांसलेशन मेमोरी, जो, हालांकि रूसी उपयोगकर्ताओं के बीच इतनी व्यापक रूप से ज्ञात नहीं है, फिर भी इसके कई फायदे हैं।

तकनीकी प्रगति के तीव्र विकास के कारण संख्या में वृद्धि हुई है तकनीकी उपकरण, कारें और अन्य जटिल उपकरण, जिनके बिना एक आधुनिक व्यक्ति का जीवन लगभग अकल्पनीय है। उदाहरण के लिए, यूरोपीय एयरबस विमान के दस्तावेज़ीकरण की मात्रा दसियों हज़ार पृष्ठों तक है। जैसा कि एलआईएसए एसोसिएशन (एलआईएसए 2004 ट्रांसलेशन मेमोरी सर्वे) द्वारा 2004 के अंत में किए गए एक अध्ययन के आंकड़ों से पता चलता है, 42% उत्तरदाता प्रति वर्ष लगभग 1 मिलियन शब्दों का अनुवाद करते हैं, सर्वेक्षण में भाग लेने वाली 24% कंपनियों के पास अनुवाद की वार्षिक मात्रा है 1-5 मिलियन में से, 12% 5 से 10 मिलियन तक अनुवाद करते हैं, अन्य कंपनियों के अनुवाद की मात्रा 10 से 500 या अधिक मिलियन शब्द प्रति वर्ष है। विशेष रूप से, अधिकांश निर्माता आज अपने स्थानीय बाजार तक ही सीमित नहीं हैं और सक्रिय रूप से क्षेत्रीय बाजार विकसित कर रहे हैं। साथ ही, उत्पाद स्थानीयकरण, जिसमें उत्पाद विवरण का स्थानीय भाषा में अनुवाद शामिल है, एक नए बाजार में प्रवेश करने के लिए आवश्यक शर्तों में से एक है।

साथ ही, हालांकि निर्माता नियमित रूप से अपने उत्पादों के नए संस्करण जारी करते हैं - कार, उत्खनन, कंप्यूटर आदि मोबाइल फोन, सॉफ़्टवेयर - ये सभी पिछले मॉडलों से मौलिक रूप से भिन्न नहीं हैं। कभी-कभी एक नया फ़ोन मॉडल पिछले मॉडल से थोड़ा संशोधित (या पुनर्निर्मित) होता है। नए संस्करण बेहतर बिकते हैं, इसलिए निर्माताओं को अपने उत्पादों को नियमित रूप से अपडेट करना पड़ता है। परिणामस्वरूप, इनमें से प्रत्येक उत्पाद का दस्तावेज़ीकरण अक्सर पिछले संस्करण के समान 70-90% होता है।

दो कारक - अनुवाद की आवश्यकता वाले दस्तावेज़ों की बड़ी मात्रा और उनकी उच्च पुनरावृत्ति - ने अनुवाद मेमोरी तकनीक (टीएम के रूप में संक्षिप्त रूप में, इस शब्द का आम तौर पर स्वीकृत रूसी अनुवाद नहीं है) बनाने के लिए एक प्रोत्साहन के रूप में कार्य किया। टीएम प्रौद्योगिकी का सार आलंकारिक रूप से एक वाक्यांश में व्यक्त किया जा सकता है: "एक ही पाठ का दो बार अनुवाद न करें।" दूसरे शब्दों में, ट्रांसलेशन मेमोरी का उपयोग पहले किए गए अनुवादों का पुन: उपयोग करने के लिए किया जाता है। यह आपको अनुवाद तैयार करने में लगने वाले समय को काफी कम करने की अनुमति देता है, खासकर जब उन पाठों के साथ काम करते समय जिनमें उच्च स्तर की पुनरावृत्ति होती है।

ट्रांसलेशन मेमोरी तकनीक को अक्सर मशीनी अनुवाद के साथ भ्रमित किया जाता है, जो निश्चित रूप से उपयोगी और दिलचस्प भी है, लेकिन इसका वर्णन इस लेख का उद्देश्य नहीं है। टीएम प्रौद्योगिकी के उपयोग से यांत्रिक कार्य की मात्रा कम होकर अनुवाद की गति बढ़ जाती है। हालाँकि, यह ध्यान रखना महत्वपूर्ण है कि टीएम अनुवादक के लिए अनुवाद नहीं करता है, लेकिन दोहराए गए पाठों का अनुवाद करते समय लागत कम करने के लिए एक शक्तिशाली उपकरण है।

टीएम तकनीक अनुवाद परिणामों को संचित करने के सिद्धांत पर काम करती है: अनुवाद प्रक्रिया के दौरान, स्रोत पाठ और उसका अनुवाद टीएम डेटाबेस में संग्रहीत किया जाता है। जानकारी को संसाधित करना और विभिन्न दस्तावेज़ों की तुलना करना आसान बनाने के लिए, ट्रांसलेशन मेमोरी सिस्टम सभी टेक्स्ट को अलग-अलग टुकड़ों में तोड़ देता है जिन्हें खंड कहा जाता है। ये खंड अक्सर वाक्य होते हैं, लेकिन अन्य विभाजन नियम अपनाए जा सकते हैं। नया पाठ लोड करते समय, टीएम सिस्टम विभाजन करता है और स्रोत पाठ के खंडों की तुलना कनेक्टेड अनुवाद डेटाबेस में पहले से उपलब्ध खंडों से करता है। यदि सिस्टम पूरी तरह या आंशिक रूप से मेल खाने वाले खंड को ढूंढने में कामयाब होता है, तो उसका अनुवाद मिलान को प्रतिशत के रूप में दर्शाते हुए प्रदर्शित किया जाता है। सहेजे गए पाठ से भिन्न खंड हाइलाइट किए गए हैं। इस प्रकार, अनुवादक केवल नए खंडों का अनुवाद कर सकता है और आंशिक रूप से मेल खाने वाले खंडों को संपादित कर सकता है।

एक नियम के रूप में, मिलान सीमा 75% से कम नहीं के स्तर पर निर्धारित की जाती है, क्योंकि यदि आप कम मिलान प्रतिशत निर्धारित करते हैं, तो पाठ संपादन की लागत बढ़ जाएगी। प्रत्येक परिवर्तन या नया अनुवाद टीएम में सहेजा जाता है, इसलिए एक ही चीज़ का दो बार अनुवाद करने की कोई आवश्यकता नहीं है!

डेटाबेस में (या डेटाबेस में, यदि अनुवाद विभिन्न विषयों पर किया जाता है) "स्रोत पाठ - सही अनुवाद" खंडों के जोड़े को संग्रहीत करके अनुवाद मेमोरी डेटाबेस को लगातार भरना भी महत्वपूर्ण है। इससे समान पाठों का अनुवाद करने में लगने वाला समय काफी कम हो जाएगा। अनुवाद की श्रम तीव्रता को कम करने के अलावा, टीएम प्रणाली सभी दस्तावेजों में शब्दावली और शैली की एकता को बनाए रखना संभव बनाती है।

टीएम प्रौद्योगिकी का उपयोग अनुवादक को निम्नलिखित लाभ प्रदान करता है:

  • श्रम उत्पादकता में वृद्धि. अनुवाद डेटाबेस से 80% मिलान खंडों को भी प्रतिस्थापित करने से अनुवाद पर खर्च होने वाला समय 50-60% तक कम हो सकता है। जैसा कि अभ्यास से पता चलता है, किसी पूर्ण अनुवाद को दोबारा अनुवाद करने की तुलना में उसे संपादित करना कहीं अधिक प्रभावी है - "स्क्रैच से";
  • अनुवादित दस्तावेज़ के विषय पर अनुवाद डेटाबेस की उपस्थिति में शब्दावली और शैली की एकता। अत्यधिक विशिष्ट दस्तावेज़ीकरण का अनुवाद करते समय यह विशेष रूप से महत्वपूर्ण है;
  • एक सामान्य अनुवाद मेमोरी डेटाबेस तक पहुंच के माध्यम से गारंटीकृत अनुवाद गुणवत्ता के साथ अनुवादकों की एक टीम के काम को व्यवस्थित करना।

अलग से, हम ध्यान दें कि पश्चिमी देशों में, जहां अनुवाद मेमोरी तकनीक लंबे समय से अनुवादकों के लिए एक अनिवार्य उपकरण बन गई है, अनुवाद डेटाबेस बनाने पर खर्च किए गए धन को लागत के रूप में नहीं, बल्कि स्थिर और उच्च गुणवत्ता वाले काम में निवेश के रूप में माना जाता है, जो इससे न केवल लाभ की लागत बढ़ती है, बल्कि कंपनी का मूल्य भी बढ़ता है।

अनुवाद मेमोरी सिस्टम का बाज़ार

ट्रांसलेशन मेमोरी सिस्टम बाजार में निर्विवाद नेता SDL-TRADOS प्रोग्राम है। 2005 की गर्मियों में, TM सिस्टम के दो सबसे बड़े डेवलपर्स का विलय हो गया - कंपनियाँ SDL और TRADOS (TRADOS ब्रांड के तहत सॉफ़्टवेयर उत्पाद कई उपयोगकर्ताओं के लिए अच्छी तरह से ज्ञात हैं), और अब वे एक संयुक्त उत्पाद जारी कर रहे हैं, जो एक मानक-निर्धारक है अनुवाद स्मृति के क्षेत्र में.

नई SDL-TRADOS प्रणाली ने (उपयोगकर्ता-कॉन्फ़िगर करने योग्य) फ़ज़ी मिलान कार्यक्षमता (अनुवाद डेटाबेस में मिलान की खोज) का विस्तार किया है, साथ ही अनुवादित दस्तावेज़ों की गुणवत्ता की जाँच करने के लिए उपकरण भी उपलब्ध कराए हैं। प्रोग्राम वर्तनी की जाँच करता है और एन्क्रिप्शन तकनीक का उपयोग करके मेमोरी ब्लॉक की सामग्री की सुरक्षा करता है।

सिस्टम वर्ड डीओसी और आरटीएफ, ऑनलाइन हेल्प आरटीएफ, पावरपॉइंट, फ्रेममेकर, फ्रेममेकर +एसजीएमएल, फ्रेमबिल्डर, इंटरलीफ, क्विकसिल्वर, वेंचुरा, क्वार्कएक्सप्रेस, पेजमेकर, एसजीएमएल/एचटीएमएल/एक्सएमएल जैसे प्रारूपों का समर्थन करता है, जिसमें एचटीएमएल हेल्प, आरसी (विंडोज रिसोर्स) भी शामिल है। , बुकमास्टर (डीसीएफ) और ट्रॉफ़। SDL-TRADOS सिस्टम के अलावा, IT बाज़ार में अन्य TM सिस्टम भी हैं। फ्रांसीसी निर्माताओं का विशेष रूप से अच्छा प्रतिनिधित्व है।

फ्रांसीसी कंपनी एट्रिल (www.atril.com) के सिस्टम को कहा जाता है। इसके डेवलपर्स ने सबसे पहले अपनी स्वयं की अनुवाद एजेंसी का आयोजन किया तकनीकी दस्तावेजजिसके बाद ट्रांसलेशन मेमोरी तकनीक पर आधारित विशेष सॉफ्टवेयर बनाने का विचार आया।

यह एक व्यवस्थित मेनू के साथ एक स्टैंडअलोन एप्लिकेशन है। सिस्टम टीएम डेटाबेस, साथ ही शब्दावली डेटाबेस और शब्दकोश कनेक्ट कर सकता है। अनुवाद प्रक्रिया एक विशेष प्रोजेक्ट शेल में की जाती है, जहां, इसे बनाते समय, जिस फ़ाइल का अनुवाद करने की आवश्यकता होती है वह संलग्न और कनेक्ट होती है अतिरिक्त सेटिंग्स: टीएम डेटाबेस, शब्दकोश, आदि। पाठ का अनुवाद एक विशेष तालिका में किया जाता है, जहां इसके मूल के प्रत्येक कॉलम के विपरीत आपको अनुवाद विकल्प भरना होगा। फायदे भी शामिल हैं अतिरिक्त कार्यविभिन्न प्रारूपों की फ़ाइलों का अनुवाद करने के लिए, जो आपको फ़ाइल के मूल स्वरूपण को संरक्षित करने की अनुमति देता है।



मित्रों को बताओ