गतिशील रेंज: संपीड़ित या मानक। रिवर्स मास्टरींग: क्या संपीड़ित रिकॉर्डिंग की गतिशील रेंज को बढ़ाना संभव है? अनुपात या संपीड़न अनुपात

संपूर्ण रचना में ध्वनि का स्तर समान है, कई विराम हैं।

गतिशील सीमा को संकुचित करना

गतिशील रेंज का संकुचित होना, या अधिक सरल शब्दों में कहें तो COMPRESSION, विभिन्न उद्देश्यों के लिए आवश्यक है, जिनमें से सबसे आम हैं:

1) संपूर्ण रचना (या उपकरण भाग) में एक समान मात्रा स्तर प्राप्त करना।

2) पूरे एल्बम/रेडियो प्रसारण में गानों के लिए एक समान वॉल्यूम स्तर प्राप्त करना।

2) बोधगम्यता में वृद्धि, मुख्य रूप से एक निश्चित भाग (स्वर, बास ड्रम) को संपीड़ित करते समय।

गतिशील सीमा संकुचन कैसे होता है?

कंप्रेसर उपयोगकर्ता द्वारा निर्दिष्ट थ्रेशोल्ड मान से तुलना करके इनपुट पर ध्वनि स्तर का विश्लेषण करता है।

यदि सिग्नल स्तर मान से नीचे है सीमा- फिर कंप्रेसर ध्वनि को बदले बिना उसका विश्लेषण करना जारी रखता है। यदि ध्वनि स्तर थ्रेशोल्ड मान से अधिक हो जाता है, तो कंप्रेसर अपनी कार्रवाई शुरू कर देता है। चूंकि कंप्रेसर की भूमिका गतिशील सीमा को संकीर्ण करना है, इसलिए यह मान लेना तर्कसंगत है कि यह सबसे बड़े और सबसे छोटे आयाम मान (सिग्नल स्तर) को सीमित करता है। पहले चरण में, सबसे बड़े मान सीमित होते हैं, जिन्हें एक निश्चित बल के साथ कम किया जाता है, जिसे कहा जाता है अनुपात(नज़रिया)। आइए एक उदाहरण देखें:

हरे रंग के वक्र ध्वनि स्तर को प्रदर्शित करते हैं; एक्स अक्ष से उनके दोलनों का आयाम जितना अधिक होगा, सिग्नल स्तर उतना ही अधिक होगा।

कंप्रेसर के संचालन के लिए पीली रेखा दहलीज (दहलीज) है। थ्रेसहोल्ड मान को अधिक बनाकर, उपयोगकर्ता इसे एक्स अक्ष से दूर ले जाता है। थ्रेशोल्ड मान को कम करके, उपयोगकर्ता इसे वाई अक्ष के करीब लाता है। यह स्पष्ट है कि थ्रेशोल्ड मान जितना कम होगा, कंप्रेसर उतना ही अधिक होगा संचालित करें और इसके विपरीत, यह जितना अधिक होगा, उतना कम होगा। यदि अनुपात मान बहुत अधिक है, तो थ्रेसहोल्ड सिग्नल स्तर तक पहुंचने के बाद, बाद के सभी सिग्नल को कंप्रेसर द्वारा मौन होने तक दबा दिया जाएगा। यदि अनुपात मान बहुत छोटा है, तो कुछ नहीं होगा। थ्रेशोल्ड और अनुपात मूल्यों की पसंद पर बाद में चर्चा की जाएगी। अब हमें खुद से निम्नलिखित प्रश्न पूछना चाहिए: बाद की सभी ध्वनियों को दबाने का क्या मतलब है? वास्तव में, इसका कोई मतलब नहीं है, हमें केवल उन आयाम मानों (चोटियों) से छुटकारा पाने की आवश्यकता है जो थ्रेशोल्ड मान (ग्राफ़ पर लाल रंग में चिह्नित) से अधिक हैं। इस समस्या को हल करने के लिए एक पैरामीटर है मुक्त करना(क्षीणन), जो संपीड़न की अवधि निर्धारित करता है।

उदाहरण से पता चलता है कि थ्रेसहोल्ड सीमा की पहली और दूसरी अधिकता थ्रेशोल्ड सीमा की तीसरी अधिकता से कम रहती है। इसलिए, यदि रिलीज़ पैरामीटर पहले दो शिखरों पर सेट है, तो तीसरे को संसाधित करते समय, एक असंसाधित भाग रह सकता है (क्योंकि थ्रेशोल्ड सीमा से अधिक समय तक रहता है)। यदि रिलीज़ पैरामीटर तीसरे शिखर पर सेट है, तो पहली और दूसरी चोटियों को संसाधित करते समय, उनके पीछे सिग्नल स्तर में अवांछनीय कमी बनती है।

अनुपात पैरामीटर के लिए भी यही बात लागू होती है। यदि अनुपात पैरामीटर को पहले दो शिखरों पर समायोजित किया जाता है, तो तीसरे को पर्याप्त रूप से दबाया नहीं जाएगा। यदि अनुपात पैरामीटर को तीसरे शिखर को संसाधित करने के लिए कॉन्फ़िगर किया गया है, तो पहले दो शिखरों का प्रसंस्करण बहुत अधिक होगा।

इन समस्याओं को दो तरीकों से हल किया जा सकता है:

1) आक्रमण पैरामीटर सेट करना (हमला) - एक आंशिक समाधान।

2) गतिशील संपीड़न - एक पूर्ण समाधान।

पैरामीटर एअभी भी (हमला)इसका उद्देश्य उस समय को निर्धारित करना है जिसके बाद कंप्रेसर थ्रेशोल्ड सीमा से अधिक होने पर काम करना शुरू कर देगा। यदि पैरामीटर शून्य के करीब है (समानांतर संपीड़न के मामले में शून्य के बराबर, संबंधित लेख देखें) - तो कंप्रेसर तुरंत सिग्नल को दबाना शुरू कर देगा, और रिलीज पैरामीटर द्वारा निर्दिष्ट समय की मात्रा के लिए काम करेगा। यदि हमले की गति अधिक है, तो कंप्रेसर एक निश्चित अवधि के बाद अपनी कार्रवाई शुरू कर देगा (स्पष्टता देने के लिए यह आवश्यक है)। हमारे मामले में, हम पहले दो शिखरों को संसाधित करने के लिए थ्रेशोल्ड (थ्रेसहोल्ड), क्षीणन (रिलीज़) और संपीड़न स्तर (अनुपात) के मापदंडों को समायोजित कर सकते हैं, और हमले के मूल्य को शून्य के करीब सेट कर सकते हैं। फिर कंप्रेसर पहले दो चोटियों को दबा देगा, और तीसरे को संसाधित करते समय, यह इसे तब तक दबाएगा जब तक कि सीमा (थ्रेसहोल्ड) पार न हो जाए। हालाँकि, यह उच्च-गुणवत्ता वाले ध्वनि प्रसंस्करण की गारंटी नहीं देता है और सीमित करने के करीब है (सभी आयाम मूल्यों का एक मोटा कटौती, इस मामले में कंप्रेसर को लिमिटर कहा जाता है)।

आइए कंप्रेसर के साथ ध्वनि प्रसंस्करण के परिणाम को देखें:

चोटियाँ गायब हो गईं, मैंने ध्यान दिया कि प्रसंस्करण सेटिंग्स काफी सभ्य थीं और हमने केवल सबसे प्रमुख आयाम मानों को दबा दिया। व्यवहार में, गतिशील सीमा बहुत कम हो जाती है और यह प्रवृत्ति केवल आगे बढ़ती है। कई संगीतकारों के दिमाग में, वे संगीत को तेज़ बनाते हैं, लेकिन व्यवहार में वे इसे उन श्रोताओं के लिए गतिशीलता से पूरी तरह से वंचित कर देते हैं जो इसे घर पर सुन रहे होंगे, रेडियो पर नहीं।

हमें बस अंतिम संपीड़न पैरामीटर, इस पर विचार करना है पाना(पाना)। गेन को संपूर्ण रचना के आयाम को बढ़ाने के लिए डिज़ाइन किया गया है और वास्तव में, यह एक अन्य ध्वनि संपादक उपकरण - सामान्यीकरण के बराबर है। आइए अंतिम परिणाम देखें:

हमारे मामले में, संपीड़न को उचित ठहराया गया और ध्वनि की गुणवत्ता में सुधार हुआ, क्योंकि प्रमुख शिखर एक जानबूझकर किए गए परिणाम की तुलना में एक दुर्घटना होने की अधिक संभावना है। इसके अलावा, यह स्पष्ट है कि संगीत लयबद्ध है, इसलिए इसकी एक संकीर्ण गतिशील सीमा है। ऐसे मामलों में जहां उच्च आयाम मान जानबूझकर हैं, संपीड़न एक गलती हो सकती है।

गतिशील संपीड़न

गतिशील संपीड़न और गैर-गतिशील संपीड़न के बीच अंतर यह है कि पूर्व के साथ, सिग्नल दमन का स्तर (अनुपात) इनपुट सिग्नल के स्तर पर निर्भर करता है। गतिशील कंप्रेसर सभी आधुनिक कार्यक्रमों में पाए जाते हैं; अनुपात और थ्रेसहोल्ड पैरामीटर को एक विंडो का उपयोग करके नियंत्रित किया जाता है (प्रत्येक पैरामीटर की अपनी धुरी होती है):

ग्राफ़ प्रदर्शित करने के लिए कोई एकल मानक नहीं है; कहीं Y अक्ष के साथ आने वाले सिग्नल का स्तर प्रदर्शित होता है, कहीं इसके विपरीत, संपीड़न के बाद सिग्नल का स्तर प्रदर्शित होता है। कहीं बिंदु (0,0) ऊपरी दाएं कोने में है, कहीं निचले बाएं कोने में है। किसी भी स्थिति में, जब आप इस फ़ील्ड पर माउस कर्सर ले जाते हैं, तो अनुपात और थ्रेशोल्ड पैरामीटर के अनुरूप संख्याओं के मान बदल जाते हैं। वे। आप प्रत्येक थ्रेशोल्ड मान के लिए संपीड़न स्तर सेट करते हैं, जिससे बहुत लचीली संपीड़न सेटिंग्स की अनुमति मिलती है।

पक्ष श्रृंखला

एक साइड चेन कंप्रेसर एक चैनल के सिग्नल का विश्लेषण करता है, और जब ध्वनि स्तर एक सीमा (सीमा) से अधिक हो जाता है, तो यह दूसरे चैनल पर संपीड़न लागू करता है। साइड चेनिंग में उन उपकरणों के साथ काम करने के अपने फायदे हैं जो एक ही आवृत्ति क्षेत्र में स्थित हैं (बास-किक संयोजन सक्रिय रूप से उपयोग किया जाता है), लेकिन कभी-कभी विभिन्न आवृत्ति क्षेत्रों में स्थित उपकरणों का भी उपयोग किया जाता है, जिससे एक दिलचस्प साइड-चेन प्रभाव होता है।

भाग दो - संपीड़न चरण

संपीड़न के तीन चरण हैं:

1) पहला चरण व्यक्तिगत ध्वनियों (सिंगलशूट) का संपीड़न है।

किसी भी वाद्य यंत्र की लय में निम्नलिखित विशेषताएं होती हैं: हमला, पकड़ना, नष्ट होना, विलंब करना, कायम रखना, छोड़ना।

व्यक्तिगत ध्वनियों के संपीड़न के चरण को दो भागों में विभाजित किया गया है:

1.1) लयबद्ध वाद्ययंत्रों की व्यक्तिगत ध्वनियों का संपीड़न

अक्सर किसी बीट के घटकों को स्पष्टता देने के लिए अलग-अलग संपीड़न की आवश्यकता होती है। कई लोग बास ड्रम को अन्य लयबद्ध उपकरणों से अलग से संसाधित करते हैं, व्यक्तिगत ध्वनियों के संपीड़न के चरण में और व्यक्तिगत भागों के संपीड़न के चरण में। यह इस तथ्य के कारण है कि यह कम-आवृत्ति क्षेत्र में स्थित है, जहां इसके अलावा, आमतौर पर केवल बास मौजूद होता है। बेस ड्रम की स्पष्टता का अर्थ है एक विशिष्ट क्लिक की उपस्थिति (बेस ड्रम में आक्रमण और धारण का समय बहुत कम होता है)। यदि कोई क्लिक नहीं है, तो आपको इसे कंप्रेसर के साथ संसाधित करने की आवश्यकता है, थ्रेसहोल्ड को शून्य पर सेट करें और हमले का समय 10 से 50 एमएस तक सेट करें। अगले किक ड्रम हिट से पहले कंप्रेसर का रोल-ऑफ (रियलीज़) समाप्त होना चाहिए। अंतिम समस्या को सूत्र का उपयोग करके हल किया जा सकता है: 60,000 / बीपीएम, जहां बीपीएम रचना की गति है। इसलिए, उदाहरण के लिए) 60,000/137=437.96 (4-आयामी संरचना की नई डाउनबीट तक समय मिलीसेकेंड में)।

उपरोक्त सभी कम हमले के समय के साथ अन्य लयबद्ध उपकरणों पर लागू होते हैं - उनके पास एक उच्चारित क्लिक होना चाहिए जिसे संपीड़न स्तर के किसी भी चरण में कंप्रेसर द्वारा दबाया नहीं जाना चाहिए।

1.2) संपीड़नव्यक्तिगत ध्वनियाँहार्मोनिक उपकरण

लयबद्ध वाद्ययंत्रों के विपरीत, हार्मोनिक वाद्ययंत्रों के हिस्से शायद ही कभी व्यक्तिगत ध्वनियों से बने होते हैं। हालाँकि, इसका मतलब यह नहीं है कि उन्हें ध्वनि संपीड़न स्तर पर संसाधित नहीं किया जाना चाहिए। यदि आप रिकॉर्ड किए गए भाग के साथ एक नमूने का उपयोग करते हैं, तो यह संपीड़न का दूसरा स्तर है। केवल संश्लेषित हार्मोनिक उपकरण ही इस संपीड़न स्तर पर लागू होते हैं। ये ध्वनि संश्लेषण (भौतिक मॉडलिंग, एफएम, एडिटिव, सबट्रैक्टिव, आदि) के विभिन्न तरीकों का उपयोग करने वाले सैंपलर, सिंथेसाइज़र हो सकते हैं। जैसा कि आप शायद पहले ही अनुमान लगा चुके हैं, हम सिंथेसाइज़र सेटिंग्स की प्रोग्रामिंग के बारे में बात कर रहे हैं। हाँ! यह भी संपीड़न है! लगभग सभी सिंथेसाइज़र में एक प्रोग्रामेबल लिफाफा पैरामीटर (एडीएसआर) होता है, जिसका अर्थ है लिफाफा। लिफाफे का उपयोग करके, आप हमले, क्षय, निरंतरता और रिहाई का समय निर्धारित करते हैं। और यदि आप मुझसे कहते हैं कि यह प्रत्येक व्यक्तिगत ध्वनि का संपीड़न नहीं है - तो आप जीवन भर के लिए मेरे दुश्मन हैं!

2) दूसरा चरण - अलग-अलग हिस्सों का संपीड़न।

व्यक्तिगत भागों के संपीड़न से मेरा तात्पर्य कई संयुक्त व्यक्तिगत ध्वनियों की गतिशील सीमा को सीमित करना है। इस चरण में स्वर सहित भागों की रिकॉर्डिंग भी शामिल है, जिसे स्पष्टता और सुगमता देने के लिए संपीड़न प्रसंस्करण की आवश्यकता होती है। संपीड़न द्वारा भागों को संसाधित करते समय, आपको यह ध्यान रखना होगा कि व्यक्तिगत ध्वनियाँ जोड़ते समय, अवांछित चोटियाँ दिखाई दे सकती हैं, जिनसे आपको इस स्तर पर छुटकारा पाने की आवश्यकता है, क्योंकि यदि अब ऐसा नहीं किया गया, तो चरण में तस्वीर खराब हो सकती है। संपूर्ण रचना को मिलाना। व्यक्तिगत भागों के संपीड़न के चरण में, व्यक्तिगत ध्वनियों के प्रसंस्करण के चरण के संपीड़न को ध्यान में रखना आवश्यक है। यदि आपने बास ड्रम की स्पष्टता हासिल कर ली है, तो दूसरे चरण में गलत पुन: प्रसंस्करण सब कुछ बर्बाद कर सकता है। कंप्रेसर के साथ सभी भागों को संसाधित करना आवश्यक नहीं है, जैसे सभी व्यक्तिगत ध्वनियों को संसाधित करना आवश्यक नहीं है। मैं आपको व्यक्तिगत ध्वनियों के संयोजन के अवांछित दुष्प्रभावों की उपस्थिति निर्धारित करने के लिए एक आयाम विश्लेषक स्थापित करने की सलाह देता हूं। इस स्तर पर संपीड़न के अलावा, यह सुनिश्चित करना आवश्यक है कि यदि संभव हो तो बैच अलग-अलग हों आवृत्ति रेंजपरिमाणीकरण के लिए. यह याद रखना भी उपयोगी है कि ध्वनि में मास्किंग (मनोध्वनिकी) जैसी विशेषता होती है:

1) एक शांत ध्वनि उसके सामने आने वाली तेज़ ध्वनि से ढक जाती है।

2) कम आवृत्ति पर शांत ध्वनि उच्च आवृत्ति पर तेज़ ध्वनि से ढक जाती है।

इसलिए, उदाहरण के लिए, यदि आपके पास एक सिंथेसाइज़र भाग है, तो अक्सर पिछले नोट्स के बजने से पहले ही नोट्स बजना शुरू हो जाते हैं। कभी-कभी यह आवश्यक होता है (सद्भाव बनाना, खेलने की शैली, पॉलीफोनी), लेकिन कभी-कभी यह बिल्कुल नहीं होता है - यदि यह एकल मोड में सुनाई देता है, लेकिन सभी भागों के प्लेबैक मोड में सुनाई नहीं देता है, तो आप उनके अंत को काट सकते हैं (विलंब - रिलीज) . यही बात रीवरब जैसे प्रभावों पर भी लागू होती है - यह तब तक नहीं रहना चाहिए जब तक ध्वनि स्रोत फिर से शुरू न हो जाए। अनावश्यक सिग्नल को काटकर और हटाकर, आप ध्वनि को स्वच्छ बनाते हैं, और इसे संपीड़न के रूप में भी माना जा सकता है - क्योंकि आप अनावश्यक तरंगों को हटा रहे हैं।

3) तीसरा चरण - रचना का संपीड़न।

संपूर्ण रचना को संपीड़ित करते समय, आपको इस तथ्य को ध्यान में रखना होगा कि सभी भाग कई व्यक्तिगत ध्वनियों का संयोजन हैं। इसलिए, उन्हें संयोजित करते समय और बाद में संपीड़न करते समय, हमें यह सुनिश्चित करना होगा कि अंतिम संपीड़न पहले दो चरणों में हमने जो हासिल किया है उसे खराब न कर दे। आपको उन रचनाओं को भी अलग करने की आवश्यकता है जिनमें विस्तृत या संकीर्ण सीमा महत्वपूर्ण है। व्यापक गतिशील रेंज के साथ रचनाओं को संपीड़ित करते समय, एक कंप्रेसर स्थापित करना पर्याप्त होता है जो भागों को एक साथ जोड़ने के परिणामस्वरूप बनी अल्पकालिक चोटियों को कुचल देगा। किसी रचना को संपीड़ित करते समय जिसमें एक संकीर्ण गतिशील सीमा महत्वपूर्ण होती है, सब कुछ बहुत अधिक जटिल होता है। यहाँ कंप्रेसर हैं हाल ही मेंअधिकतमकर्ता कहलाते हैं। मैक्सिमाइज़र एक प्लगइन है जो कंप्रेसर, लिमिटर, ग्राफिक इक्वलाइज़र, एनहाइज़र और अन्य ध्वनि परिवर्तन उपकरण को जोड़ता है। साथ ही उसके पास ध्वनि विश्लेषण उपकरण भी होने चाहिए। मैक्सिमाइज़िंग, एक कंप्रेसर के साथ अंतिम प्रसंस्करण, पिछले चरणों में की गई गलतियों से निपटने के लिए काफी हद तक आवश्यक है। त्रुटियाँ - संपीड़न में इतनी अधिक नहीं (हालाँकि, यदि आप अंतिम चरण में वही करते हैं जो आप पहले चरण में कर सकते थे, तो यह पहले से ही एक गलती है), लेकिन अच्छे नमूनों और उपकरणों के प्रारंभिक चयन में जो प्रत्येक में हस्तक्षेप नहीं करेंगे अन्य (हम फ़्रीक्वेंसी रेंज के बारे में बात कर रहे हैं)। ठीक इसी कारण से आवृत्ति प्रतिक्रिया को ठीक किया जाता है। अक्सर ऐसा होता है कि मास्टर पर मजबूत संपीड़न के साथ, पहले चरण में संपीड़न और मिश्रण मापदंडों को बदलना आवश्यक होता है, क्योंकि गतिशील रेंज की एक मजबूत संकुचन के साथ, शांत ध्वनियाँ जो पहले छिपी हुई थीं, बाहर आती हैं, और व्यक्तिगत घटकों की ध्वनि रचना में परिवर्तन होता है।

इन भागों में, मैंने जानबूझकर विशिष्ट संपीड़न मापदंडों के बारे में बात नहीं की। मैंने इस तथ्य के बारे में लिखना आवश्यक समझा कि संपीड़न करते समय रचना निर्माण के सभी चरणों में सभी ध्वनियों और सभी भागों पर ध्यान देना आवश्यक है। यही एकमात्र तरीका है जिससे अंत में आपको न केवल संगीत सिद्धांत के दृष्टिकोण से, बल्कि ध्वनि इंजीनियरिंग के दृष्टिकोण से भी सामंजस्यपूर्ण परिणाम मिलेगा।

नीचे दी गई तालिका देती है प्रायोगिक उपकरणव्यक्तिगत बैचों के प्रसंस्करण के लिए। हालाँकि, संपीड़न में, संख्याएँ और प्रीसेट केवल वांछित क्षेत्र का सुझाव दे सकते हैं जिसमें खोजना है। आदर्श संपीड़न सेटिंग्स प्रत्येक व्यक्तिगत मामले पर निर्भर करती हैं। गेन और थ्रेशोल्ड पैरामीटर एक सामान्य ध्वनि स्तर (संपूर्ण रेंज का तार्किक उपयोग) मानते हैं।

भाग तीन - संपीड़न पैरामीटर

संक्षिप्त जानकारी:

थ्रेसहोल्ड - आने वाले सिग्नल के ध्वनि स्तर को निर्धारित करता है, जिस पर पहुंचने पर कंप्रेसर काम करना शुरू कर देता है।

हमला - वह समय निर्धारित करता है जिसके बाद कंप्रेसर काम करना शुरू कर देगा।

स्तर (अनुपात) - आयाम मूल्यों में कमी की डिग्री निर्धारित करता है (मूल आयाम मूल्य के सापेक्ष)।

रिलीज - उस समय को परिभाषित करता है जिसके बाद कंप्रेसर काम करना बंद कर देगा।

लाभ - कंप्रेसर द्वारा प्रसंस्करण के बाद आने वाले सिग्नल में वृद्धि के स्तर को निर्धारित करता है।

संपीड़न तालिका:

औजार	सीमा	आक्रमण करना	अनुपात	मुक्त करना	पाना	विवरण
वोकल्स	0 डीबी	1-2 मि 2-5 एमएस 10 एमएस 0.1 एमएस 0.1 एमएस	4:1 से कम 2,5: 1 4:1 – 12:1 2:1 -8:1	150 एमएस 50-100 एमएस 150 एमएस 150 एमएस 0.5s		रिकॉर्डिंग के दौरान संपीड़न न्यूनतम होना चाहिए; स्पष्टता और सुगमता देने के लिए मिश्रण चरण में अनिवार्य प्रसंस्करण की आवश्यकता होती है।
हवा उपकरण		1 - 5 मि.से	6:1 – 15:1	0.3s
बैरल		10 से 50 एमएस 10-100 एमएस	4:1 और उच्चतर 10:1	50-100 एमएस 1 एमएस		थ्रेशोल्ड जितना कम होगा और अनुपात जितना अधिक होगा और हमला जितना लंबा होगा, किक ड्रम की शुरुआत में क्लिक उतना ही अधिक स्पष्ट होगा।
सिंथेसाइज़र						तरंग प्रकार (एडीएसआर लिफाफे) पर निर्भर करता है।
ड्रम फन्दे:		10-40 एमएस 1- 5 मि.से	5:1 5:1 – 10:1	50 एमएस 0.2s
हाय टोपी		20 एमएस	10:1	1 एमएस
ओवरहेड माइक्रोफोन		2-5 एमएस	5:1	1-50 एमएस
ड्रम		5ms	5:1 – 8:1	10ms
बास-गिटार		100-200 एमएस 4ms से 10ms	5:1	1 एमएस 10ms
स्ट्रिंग्स		0-40 एमएस	3:1	500 एमएस
सिंथ। बास		4ms - 10ms	4:1	10ms		लिफाफे पर निर्भर करता है.

टक्कर		0-20 एमएस	10:1	50 एमएस
ध्वनिक गिटार, पियानो		10-30 एमएस 5 - 10 मि.से	4:1 5:1 -10:1	50-100 एमएस 0.5s
इलेक्ट्रो-निटारा		2 - 5 मि.से	8:1	0.5s

अंतिम संपीड़न		0.1 एमएस 0.1 एमएस	2:1 2:1 से 3:1 तक	50 एमएस 0.1 एमएस	0 डीबी आउटपुट	हमले का समय उद्देश्य पर निर्भर करता है - चाहे आपको चोटियाँ हटाने की ज़रूरत हो या ट्रैक को चिकना बनाने की।
अंतिम संपीड़न के बाद सीमक		0 एमएस	10:1	10-50 एमएस	0 डीबी आउटपुट	यदि आपको एक संकीर्ण गतिशील रेंज और तरंगों का एक मोटा "कट" चाहिए।

जानकारी इंटरनेट पर लोकप्रिय संसाधनों द्वारा संदर्भित विभिन्न स्रोतों से ली गई थी। संपीड़न मापदंडों में अंतर को विभिन्न ध्वनि प्राथमिकताओं और विभिन्न सामग्रियों के साथ काम करने से समझाया गया है।

आइए इस प्रश्न पर विचार करें - हमें वॉल्यूम बढ़ाने की आवश्यकता क्यों है? शांत ध्वनियाँ सुनने के लिए जो हमारी परिस्थितियों में श्रव्य नहीं हैं (उदाहरण के लिए, यदि आप ऊँची आवाज़ में नहीं सुन सकते, यदि वहाँ है) बाहरी शोरकमरे में, आदि)। क्या तेज़ ध्वनि को छोड़ कर शांत ध्वनि को बढ़ाना संभव है? यह पता चला कि यह संभव है. इस तकनीक को डायनेमिक रेंज कम्प्रेशन (DRC) कहा जाता है। ऐसा करने के लिए, आपको वर्तमान वॉल्यूम को लगातार बदलने की ज़रूरत है - शांत ध्वनियों को बढ़ाएं, तेज़ आवाज़ों को - नहीं। आयतन परिवर्तन का सबसे सरल नियम रैखिक है, अर्थात। वॉल्यूम आउटपुट_लाउडनेस = के * इनपुट_लाउडनेस कानून के अनुसार बदलता है, जहां के डायनेमिक रेंज संपीड़न अनुपात है:

चित्र 18. गतिशील रेंज संपीड़न।

जब k = 1, कोई परिवर्तन नहीं किया जाता है (आउटपुट वॉल्यूम इनपुट वॉल्यूम के बराबर है)। के पर< 1 громкость будет увеличиваться, а динамический диапазон - сужаться. Посмотрим на график (k=1/2) - тихий звук, имевший громкость -50дБ станет громче на 25дБ, что значительно громче, но при этом громкость диалогов (-27дБ) повысится всего лишь на 13.5дБ, а громкость самых громких звуков (0дБ) вообще не изменится. При k >1 - वॉल्यूम कम हो जाएगा और डायनामिक रेंज बढ़ जाएगी।

आइए वॉल्यूम ग्राफ़ देखें (k = 1/2: DD संपीड़न दोगुना हो गया है):

चित्र 19. प्रबलता रेखांकन।

जैसा कि आप मूल में देख सकते हैं, बहुत शांत ध्वनियाँ थीं, संवाद स्तर से 30 डीबी नीचे, और बहुत तेज़ - संवाद स्तर से 30 डीबी ऊपर। वह। डायनामिक रेंज 60dB थी। संपीड़न के बाद, तेज़ ध्वनियाँ केवल 15dB अधिक होती हैं, और शांत ध्वनियाँ संवाद से 15dB कम होती हैं (गतिशील सीमा अब 30dB है)। इस प्रकार, तेज़ आवाज़ें काफी शांत हो गईं, और शांत आवाज़ें काफी तेज़ हो गईं। इस मामले में, कोई अतिप्रवाह नहीं है!

आइए अब हिस्टोग्राम देखें:

चित्र 20. संपीड़न उदाहरण.

जैसा कि आप स्पष्ट रूप से देख सकते हैं, +30 डीबी तक के प्रवर्धन के साथ, हिस्टोग्राम का आकार अच्छी तरह से संरक्षित होता है, जिसका अर्थ है कि तेज़ ध्वनियाँ अच्छी तरह से व्यक्त रहती हैं (वे अधिकतम तक नहीं जाती हैं और कटती नहीं हैं, जैसा कि साधारण प्रवर्धन के साथ होता है) . इससे शांत ध्वनियाँ उत्पन्न होती हैं। हिस्टोग्राम इसे खराब तरीके से दिखाता है, लेकिन कान से अंतर बहुत ध्यान देने योग्य है। इस पद्धति का नुकसान समान वॉल्यूम जंप है। हालाँकि, उनकी घटना का तंत्र काटने के दौरान होने वाली ज़ोर की छलांग से भिन्न होता है, और उनका चरित्र अलग होता है - वे मुख्य रूप से तब दिखाई देते हैं जब शांत ध्वनियों को बहुत दृढ़ता से बढ़ाया जाता है (और तब नहीं जब तेज़ आवाज़ को काटा जाता है, जैसा कि सामान्य प्रवर्धन के साथ होता है)। संपीड़न के अत्यधिक स्तर से ध्वनि चित्र चपटा हो जाता है - सभी ध्वनियाँ समान प्रबलता और अव्यंजकता वाली होती हैं।

शांत ध्वनियों के अत्यधिक प्रवर्धन के कारण रिकॉर्डिंग शोर सुनाई देने योग्य हो सकता है। इसलिए, फ़िल्टर थोड़ा संशोधित एल्गोरिदम का उपयोग करता है ताकि शोर का स्तर कम हो:

चित्र 21. शोर बढ़ाए बिना वॉल्यूम बढ़ाना।

वे। -50 डीबी के वॉल्यूम स्तर पर, ट्रांसफर फ़ंक्शन विभक्त हो जाता है, और शोर कम बढ़ जाएगा (पीली रेखा)। इस तरह के विभक्ति के अभाव में, शोर बहुत तेज़ (ग्रे लाइन) होगा। यह सरल संशोधन बहुत उच्च संपीड़न स्तर (चित्र में 1:5 संपीड़न) पर भी शोर की मात्रा को काफी कम कर देता है। फ़िल्टर में "DRC" स्तर शांत ध्वनियों (-50dB पर) के लिए लाभ स्तर निर्धारित करता है, अर्थात। चित्र में दिखाया गया 1/5 संपीड़न स्तर फ़िल्टर सेटिंग्स में +40dB स्तर से मेल खाता है।

या फोटोग्राफिक अक्षांशफ़ोटोग्राफ़िक सामग्री अधिकतम और न्यूनतम एक्सपोज़र मानों के बीच का अनुपात है जिसे फ़ोटोग्राफ़ में सही ढंग से कैप्चर किया जा सकता है। के लिए आवेदन किया डिजिटल फोटोग्राफीडायनामिक रेंज वास्तव में एक्सपोज़र के दौरान फोटोसेंसर द्वारा उत्पन्न उपयोगी विद्युत सिग्नल के अधिकतम और न्यूनतम संभव मूल्यों के अनुपात के बराबर है।

डायनामिक रेंज को एक्सपोज़र स्टॉप्स () में मापा जाता है। प्रत्येक चरण प्रकाश की मात्रा को दोगुना करने से मेल खाता है। इसलिए, उदाहरण के लिए, यदि एक निश्चित कैमरे की गतिशील रेंज 8 ईवी है, तो इसका मतलब है कि इसके मैट्रिक्स के उपयोगी सिग्नल का अधिकतम संभव मूल्य न्यूनतम 2 8: 1 से संबंधित है, जिसका अर्थ है कि कैमरा है एक फ्रेम के भीतर चमक में भिन्न वस्तुओं को 256 बार से अधिक कैप्चर करने में सक्षम। अधिक सटीक रूप से, यह किसी भी चमक के साथ वस्तुओं को कैप्चर कर सकता है, लेकिन जिन वस्तुओं की चमक अधिकतम स्वीकार्य मूल्य से अधिक है, वे छवि में चमकदार सफेद दिखाई देंगी, और जिन वस्तुओं की चमक न्यूनतम मूल्य से कम है, वे पिच काली दिखाई देंगी। विवरण और बनावट केवल उन्हीं वस्तुओं पर दिखाई देगी जिनकी चमक कैमरे की गतिशील सीमा के भीतर आती है।

फोटो खींची जा रही सबसे हल्की और सबसे गहरी वस्तुओं की चमक के बीच संबंध का वर्णन करने के लिए, पूरी तरह से सही शब्द "दृश्य गतिशील रेंज" का उपयोग अक्सर नहीं किया जाता है। चमक रेंज या कंट्रास्ट स्तर के बारे में बात करना अधिक सही होगा, क्योंकि गतिशील रेंज आमतौर पर मापने वाले उपकरण की एक विशेषता है (इस मामले में, एक डिजिटल कैमरे का मैट्रिक्स)।

दुर्भाग्य से, वास्तविक जीवन में हमारे सामने आने वाले कई खूबसूरत दृश्यों की चमक रेंज डिजिटल कैमरे की गतिशील रेंज से काफी अधिक हो सकती है। ऐसे मामलों में, फोटोग्राफर को यह तय करने के लिए मजबूर किया जाता है कि किन वस्तुओं पर पूर्ण विवरण में काम किया जाना चाहिए, और जिन्हें रचनात्मक इरादे से समझौता किए बिना गतिशील सीमा के बाहर छोड़ा जा सकता है। अपने कैमरे की गतिशील रेंज का अधिकतम लाभ उठाने के लिए, आपको कभी-कभी फोटोसेंसर कैसे काम करता है इसकी गहन समझ की आवश्यकता नहीं होती है, बल्कि एक विकसित कलात्मक समझ की आवश्यकता होती है।

गतिशील रेंज को सीमित करने वाले कारक

गतिशील रेंज की निचली सीमा फोटोसेंसर के स्व-शोर स्तर द्वारा निर्धारित की जाती है। यहां तक कि एक अप्रकाशित मैट्रिक्स भी एक पृष्ठभूमि विद्युत संकेत उत्पन्न करता है जिसे डार्क नॉइज़ कहा जाता है। इसके अलावा, हस्तक्षेप तब होता है जब चार्ज को एनालॉग-टू-डिजिटल कनवर्टर में स्थानांतरित किया जाता है, और एडीसी स्वयं डिजीटल सिग्नल में एक निश्चित त्रुटि पेश करता है - तथाकथित। नमूना शोर.

यदि आप पूर्ण अंधकार में या लेंस कैप लगाकर फोटो लेते हैं, तो कैमरा केवल इस अर्थहीन शोर को रिकॉर्ड करेगा। यदि आप सेंसर तक न्यूनतम मात्रा में प्रकाश पहुंचने देते हैं, तो फोटोडायोड जमा होने लगेंगे बिजली का आवेश. चार्ज का परिमाण, और इसलिए उपयोगी सिग्नल की तीव्रता, कैप्चर किए गए फोटॉनों की संख्या के समानुपाती होगी। किसी भी सार्थक विवरण को छवि में प्रदर्शित करने के लिए, यह आवश्यक है कि उपयोगी सिग्नल का स्तर पृष्ठभूमि शोर के स्तर से अधिक हो।

इस प्रकार, गतिशील रेंज की निचली सीमा या, दूसरे शब्दों में, सेंसर संवेदनशीलता सीमा को औपचारिक रूप से आउटपुट सिग्नल के स्तर के रूप में परिभाषित किया जा सकता है जिस पर सिग्नल-टू-शोर अनुपात एकता से अधिक है।

गतिशील रेंज की ऊपरी सीमा एक व्यक्तिगत फोटोडायोड की धारिता द्वारा निर्धारित की जाती है। यदि एक्सपोज़र के दौरान कोई भी फोटोडायोड अपने अधिकतम मूल्य का विद्युत चार्ज जमा करता है, तो अतिभारित फोटोडायोड के अनुरूप छवि पिक्सेल पूरी तरह से सफेद हो जाएगा, और आगे विकिरण किसी भी तरह से इसकी चमक को प्रभावित नहीं करेगा। इस घटना को क्लिपिंग कहा जाता है। किसी फोटोडायोड की अधिभार क्षमता जितनी अधिक होगी, वह संतृप्ति तक पहुंचने से पहले उतना अधिक आउटपुट सिग्नल उत्पन्न कर सकता है।

अधिक स्पष्टता के लिए, आइए हम विशेषता वक्र की ओर मुड़ें, जो आउटपुट सिग्नल बनाम एक्सपोज़र का एक ग्राफ है। पर क्षैतिज अक्षसेंसर द्वारा प्राप्त विकिरण के द्विआधारी लघुगणक को प्लॉट किया जाता है, और ऊर्ध्वाधर रेखा पर इस विकिरण के जवाब में सेंसर द्वारा उत्पन्न विद्युत संकेत के परिमाण का द्विआधारी लघुगणक होता है। मेरी ड्राइंग काफी हद तक पारंपरिक है और पूरी तरह से उदाहरणात्मक उद्देश्यों को पूरा करती है। वास्तविक फोटोसेंसर के विशिष्ट वक्र का आकार थोड़ा अधिक जटिल होता है, और शोर का स्तर शायद ही कभी इतना अधिक होता है।

ग्राफ स्पष्ट रूप से दो महत्वपूर्ण मोड़ दिखाता है: उनमें से पहले में, उपयोगी सिग्नल का स्तर शोर सीमा को पार करता है, और दूसरे में, फोटोडायोड संतृप्ति तक पहुंचते हैं। इन दो बिंदुओं के बीच स्थित एक्सपोज़र मान गतिशील रेंज बनाते हैं। इस अमूर्त उदाहरण में, यह बराबर है, जैसा कि देखना आसान है, 5 ईवी, यानी। कैमरा पांच बार एक्सपोज़र को दोगुना कर सकता है, जो चमक में 32 गुना (2 5 = 32) अंतर के बराबर है।

डायनामिक रेंज बनाने वाले एक्सपोज़र ज़ोन असमान हैं। ऊपरी क्षेत्रों में सिग्नल-टू-शोर अनुपात अधिक होता है, और इसलिए निचले क्षेत्रों की तुलना में साफ और अधिक विस्तृत दिखाई देते हैं। नतीजतन, गतिशील रेंज की ऊपरी सीमा बहुत महत्वपूर्ण और ध्यान देने योग्य है - क्लिपिंग थोड़े से अधिक एक्सपोज़र पर प्रकाश को काट देती है, जबकि निचली सीमा अस्पष्ट रूप से शोर में डूब जाती है, और काले रंग में संक्रमण सफेद जितना तेज नहीं होता है।

एक्सपोज़र पर सिग्नल की रैखिक निर्भरता, साथ ही पठार तक तेज वृद्धि, डिजिटल फोटोग्राफिक प्रक्रिया की अनूठी विशेषताएं हैं। तुलना के लिए, पारंपरिक फोटोग्राफिक फिल्म के विशिष्ट विशेषता वक्र पर एक नज़र डालें।

वक्र का आकार और विशेष रूप से झुकाव का कोण दृढ़ता से फिल्म के प्रकार और इसके विकास की प्रक्रिया पर निर्भर करता है, लेकिन फिल्म ग्राफ और डिजिटल ग्राफ के बीच मुख्य, उल्लेखनीय अंतर अपरिवर्तित रहता है - निर्भरता की गैर-रेखीय प्रकृति एक्सपोज़र वैल्यू पर फिल्म का ऑप्टिकल घनत्व।

नकारात्मक फिल्म के फोटोग्राफिक अक्षांश की निचली सीमा घूंघट के घनत्व से निर्धारित होती है, और ऊपरी सीमा फोटोग्राफिक परत के अधिकतम प्राप्य ऑप्टिकल घनत्व से निर्धारित होती है; प्रतिवर्ती फिल्मों के लिए यह दूसरा तरीका है। छाया और हाइलाइट दोनों में, विशेषता वक्र में चिकने मोड़ देखे जाते हैं, जो गतिशील सीमा की सीमाओं के करीब पहुंचने पर कंट्रास्ट में गिरावट का संकेत देते हैं, क्योंकि वक्र का ढलान छवि के कंट्रास्ट के समानुपाती होता है। इस प्रकार, ग्राफ़ के मध्य भाग में स्थित एक्सपोज़र ज़ोन में अधिकतम कंट्रास्ट होता है, जबकि हाइलाइट्स और छाया में कंट्रास्ट कम हो जाता है। व्यवहार में, फिल्म और डिजिटल मैट्रिक्स के बीच अंतर हाइलाइट्स में विशेष रूप से ध्यान देने योग्य है: जहां एक डिजिटल छवि में हाइलाइट्स को क्लिपिंग द्वारा जला दिया जाता है, फिल्म पर विवरण अभी भी दिखाई देते हैं, हालांकि इसके विपरीत कम है, और संक्रमण शुद्ध सफेद चिकना और प्राकृतिक दिखता है।

सेंसिटोमेट्री में, दो स्वतंत्र शब्दों का भी उपयोग किया जाता है: वास्तव में फोटोग्राफिक अक्षांश, विशेषता वक्र के अपेक्षाकृत रैखिक भाग द्वारा सीमित, और उपयोगी फोटोग्राफिक अक्षांश, जिसमें रैखिक अनुभाग के अलावा, चार्ट का आधार और कंधा भी शामिल है।

यह उल्लेखनीय है कि डिजिटल तस्वीरों को संसाधित करते समय, एक नियम के रूप में, उन पर अधिक या कम स्पष्ट एस-आकार का वक्र लगाया जाता है, जो छाया और हाइलाइट्स में इसे कम करने की कीमत पर मिडटोन में कंट्रास्ट को बढ़ाता है, जो डिजिटल छवि को और अधिक देता है। आंखों के लिए प्राकृतिक और मनभावन स्वरूप।

थोड़ी गहराई

डिजिटल कैमरे के मैट्रिक्स के विपरीत, मानव दृष्टि की विशेषता, मान लीजिए, दुनिया का एक लघुगणकीय दृश्य है। प्रकाश की मात्रा के लगातार दोगुने होने को हम चमक में समान परिवर्तन के रूप में देखते हैं। प्रकाश संख्याओं की तुलना संगीतमय सप्तक से भी की जा सकती है, क्योंकि ध्वनि आवृत्ति में दोहरे परिवर्तन को कान एकल संगीत अंतराल के रूप में मानते हैं। अन्य इंद्रियाँ इसी सिद्धांत पर कार्य करती हैं। धारणा की गैर-रैखिकता अलग-अलग तीव्रता की उत्तेजनाओं के प्रति मानवीय संवेदनशीलता की सीमा को काफी हद तक बढ़ा देती है।

एक RAW फ़ाइल को परिवर्तित करते समय (इससे कोई फर्क नहीं पड़ता - कैमरे का उपयोग करके या RAW कनवर्टर में) जिसमें रैखिक डेटा होता है, तथाकथित। गामा वक्र, जिसे एक डिजिटल छवि की चमक को गैर-रैखिक रूप से बढ़ाने के लिए डिज़ाइन किया गया है, जो इसे मानव दृष्टि की विशेषताओं के अनुरूप लाता है।

रैखिक रूपांतरण के साथ, छवि बहुत गहरी है।

गामा सुधार के बाद, चमक सामान्य हो जाती है।

गामा वक्र गहरे स्वरों को फैलाता है और हल्के स्वरों को संकुचित करता है, जिससे ग्रेडेशन का वितरण अधिक समान हो जाता है। नतीजा एक प्राकृतिक दिखने वाली छवि है, लेकिन छाया में शोर और नमूना कलाकृतियां अनिवार्य रूप से अधिक ध्यान देने योग्य हो जाती हैं, जो केवल निचले क्षेत्रों में चमक के स्तर की कम संख्या से बढ़ जाती है।

चमक उन्नयन का रैखिक वितरण।

गामा वक्र लगाने के बाद समान वितरण।

आईएसओ और गतिशील रेंज

इस तथ्य के बावजूद कि डिजिटल फोटोग्राफी फिल्म फोटोग्राफी की तरह फोटोग्राफिक सामग्री की फोटो संवेदनशीलता की एक ही अवधारणा का उपयोग करती है, यह समझा जाना चाहिए कि यह पूरी तरह से परंपरा के कारण होता है, क्योंकि डिजिटल और फिल्म फोटोग्राफी में बदलती फोटो संवेदनशीलता के दृष्टिकोण मौलिक रूप से भिन्न होते हैं।

पारंपरिक फोटोग्राफी में आईएसओ संवेदनशीलता बढ़ाने का मतलब है एक फिल्म को मोटे दाने वाली दूसरी फिल्म से बदलना, यानी। फोटोग्राफिक सामग्री के गुणों में ही वस्तुनिष्ठ परिवर्तन होता है। एक डिजिटल कैमरे में, सेंसर की प्रकाश संवेदनशीलता उसकी भौतिक विशेषताओं द्वारा सख्ती से निर्धारित होती है और इसे शाब्दिक अर्थ में नहीं बदला जा सकता है। आईएसओ बढ़ाने पर, कैमरा सेंसर की वास्तविक संवेदनशीलता को नहीं बदलता है, बल्कि केवल विकिरण के जवाब में सेंसर द्वारा उत्पन्न विद्युत सिग्नल को बढ़ाता है और इस सिग्नल के लिए डिजिटलीकरण एल्गोरिदम को तदनुसार समायोजित करता है।

इसका एक महत्वपूर्ण परिणाम यह है कि प्रभावी गतिशील रेंज आईएसओ में वृद्धि के अनुपात में घट जाती है, क्योंकि उपयोगी सिग्नल के साथ-साथ शोर भी बढ़ जाता है। यदि आईएसओ 100 पर सिग्नल मानों की पूरी श्रृंखला को डिजिटल किया जाता है - शून्य से संतृप्ति बिंदु तक, तो आईएसओ 200 पर फोटोडायोड की केवल आधी क्षमता को अधिकतम के रूप में लिया जाता है। आईएसओ संवेदनशीलता के प्रत्येक दोहरीकरण के साथ, गतिशील रेंज का शीर्ष चरण कट जाता है, और शेष चरण उसके स्थान पर खींच लिए जाते हैं। यही कारण है कि अति-उच्च आईएसओ मूल्यों का उपयोग करने का कोई व्यावहारिक अर्थ नहीं है। उसी सफलता के साथ, आप RAW कनवर्टर में फोटो को हल्का कर सकते हैं और एक तुलनीय शोर स्तर प्राप्त कर सकते हैं। आईएसओ बढ़ाने और छवि को कृत्रिम रूप से चमकाने के बीच अंतर यह है कि आईएसओ बढ़ाते समय, एडीसी में प्रवेश करने से पहले सिग्नल को बढ़ाया जाता है, जिसका अर्थ है कि सेंसर के स्वयं के शोर के विपरीत, परिमाणीकरण शोर को बढ़ाया नहीं जाता है, जबकि रॉ कनवर्टर में यह होता है एडीसी त्रुटियों सहित प्रवर्धन के अधीन। इसके अलावा, नमूनाकरण सीमा को कम करने का अर्थ है शेष इनपुट सिग्नल मानों का अधिक सटीक नमूनाकरण।

वैसे, कुछ उपकरणों पर उपलब्ध आईएसओ को आधार मान से नीचे (उदाहरण के लिए, आईएसओ 50 तक) कम करने से डायनेमिक रेंज का बिल्कुल भी विस्तार नहीं होता है, बल्कि सिग्नल आधे से कम हो जाता है, जो छवि को काला करने के बराबर है रॉ कनवर्टर. इस फ़ंक्शन को हानिकारक भी माना जा सकता है, क्योंकि न्यूनतम आईएसओ मान का उपयोग कैमरे को एक्सपोज़र बढ़ाने के लिए उकसाता है, जिससे सेंसर संतृप्ति सीमा अपरिवर्तित रहती है, जिससे हाइलाइट्स में क्लिपिंग का खतरा बढ़ जाता है।

सच्ची गतिशील रेंज

ऐसे कई प्रोग्राम हैं जैसे (डीएक्सओ एनालाइज़र, इमैटेस्ट, रॉडिगर, आदि) जो आपको घर पर डिजिटल कैमरे की गतिशील रेंज को मापने की अनुमति देते हैं। सिद्धांत रूप में, यह बहुत आवश्यक नहीं है, क्योंकि अधिकांश कैमरों का डेटा इंटरनेट पर स्वतंत्र रूप से पाया जा सकता है, उदाहरण के लिए, वेबसाइट DxOMark.com पर।

क्या हमें ऐसे परीक्षणों के परिणामों पर विश्वास करना चाहिए? अत्यंत। एकमात्र चेतावनी के साथ कि ये सभी परीक्षण प्रभावी या, बोलने के लिए, तकनीकी गतिशील रेंज, यानी निर्धारित करते हैं। मैट्रिक्स के संतृप्ति स्तर और शोर स्तर के बीच संबंध। एक फोटोग्राफर के लिए, सबसे महत्वपूर्ण चीज उपयोगी गतिशील रेंज है, अर्थात। एक्सपोज़र ज़ोन की संख्या जो वास्तव में आपको कुछ उपयोगी जानकारी प्राप्त करने की अनुमति देती है।

जैसा कि आपको याद है, डायनामिक रेंज थ्रेशोल्ड फोटोसेंसर के शोर स्तर द्वारा निर्धारित किया जाता है। समस्या यह है कि व्यवहार में निचले क्षेत्र, जो तकनीकी रूप से पहले से ही गतिशील रेंज में शामिल हैं, में अभी भी उपयोगी उपयोग के लिए बहुत अधिक शोर है। यहां बहुत कुछ व्यक्तिगत घृणा पर निर्भर करता है - हर कोई अपने लिए स्वीकार्य शोर स्तर निर्धारित करता है।

मेरी व्यक्तिपरक राय यह है कि सिग्नल-टू-शोर अनुपात कम से कम आठ होने पर छाया में विवरण कम या ज्यादा सभ्य दिखने लगते हैं। इस आधार पर, मैं उपयोगी डायनेमिक रेंज को तकनीकी डायनेमिक रेंज शून्य से लगभग तीन स्टॉप के रूप में परिभाषित करता हूं।

उदाहरण के लिए, यदि विश्वसनीय परीक्षणों के अनुसार एक डीएसएलआर कैमरे की डायनेमिक रेंज 13 ईवी है, जो आज के मानकों के हिसाब से बहुत अच्छी है, तो इसकी उपयोगी डायनेमिक रेंज लगभग 10 ईवी होगी, जो सामान्य तौर पर भी काफी अच्छी है। बेशक, हम न्यूनतम आईएसओ और अधिकतम बिट गहराई के साथ रॉ में शूटिंग के बारे में बात कर रहे हैं। जेपीईजी की शूटिंग करते समय, डायनामिक रेंज कंट्रास्ट सेटिंग्स पर अत्यधिक निर्भर होती है, लेकिन औसतन आपको दो या तीन स्टॉप छोड़ देना चाहिए।

तुलना के लिए: कलर रिवर्सल फिल्मों में 5-6 स्टॉप का उपयोगी फोटोग्राफिक अक्षांश होता है; ब्लैक एंड व्हाइट नकारात्मक फिल्में मानक विकास और मुद्रण प्रक्रियाओं के साथ 9-10 स्टॉप देती हैं, और कुछ हेरफेर के साथ - 16-18 स्टॉप तक।

उपरोक्त को संक्षेप में प्रस्तुत करने के लिए, आइए कुछ सरल नियम बनाने का प्रयास करें, जिनका पालन करने से आपको अपने कैमरे के सेंसर से अधिकतम प्रदर्शन प्राप्त करने में मदद मिलेगी:

डिजिटल कैमरे की डायनामिक रेंज केवल RAW में शूटिंग करते समय ही पूरी तरह से पहुंच योग्य होती है।
प्रकाश संवेदनशीलता बढ़ने पर गतिशील रेंज कम हो जाती है, इसलिए जब तक बिल्कुल आवश्यक न हो, उच्च आईएसओ सेटिंग्स से बचें।
RAW फ़ाइलों के लिए उच्च बिट गहराई का उपयोग करने से वास्तविक गतिशील रेंज में वृद्धि नहीं होती है, लेकिन यह अधिक चमक स्तरों के कारण छाया में टोनल पृथक्करण में सुधार करता है।
दाईं ओर एक्सपोज़र. ऊपरी एक्सपोज़र ज़ोन में हमेशा अधिकतम होता है उपयोगी जानकारीन्यूनतम शोर के साथ और सबसे कुशलतापूर्वक उपयोग किया जाना चाहिए। उसी समय, क्लिपिंग के खतरे के बारे में मत भूलना - जो पिक्सेल संतृप्ति तक पहुँच चुके हैं वे बिल्कुल बेकार हैं।

और सबसे महत्वपूर्ण बात: अपने कैमरे की गतिशील रेंज के बारे में बहुत अधिक चिंता न करें। इसकी डायनामिक रेंज ठीक है। प्रकाश को देखने और एक्सपोज़र को सही ढंग से प्रबंधित करने की आपकी क्षमता कहीं अधिक महत्वपूर्ण है। एक अच्छा फोटोग्राफर फोटोग्राफिक अक्षांश की कमी के बारे में शिकायत नहीं करेगा, बल्कि अधिक आरामदायक रोशनी की प्रतीक्षा करेगा, या कोण बदल देगा, या फ्लैश का उपयोग करेगा, एक शब्द में, परिस्थितियों के अनुसार कार्य करेगा। मैं आपको और अधिक बताऊंगा: कुछ दृश्य केवल इस तथ्य से लाभान्वित होते हैं कि वे कैमरे की गतिशील रेंज में फिट नहीं होते हैं। अक्सर विवरणों की अनावश्यक बहुतायत को अर्ध-अमूर्त काले सिल्हूट में छिपाने की आवश्यकता होती है, जो फोटो को अधिक संक्षिप्त और समृद्ध दोनों बनाता है।

उच्च कंट्रास्ट हमेशा एक बुरी चीज़ नहीं होती है - आपको बस यह जानना होगा कि इसके साथ कैसे काम करना है। उपकरण की कमियों के साथ-साथ उसके फायदों का भी फायदा उठाना सीखें, और आपको आश्चर्य होगा कि आपकी रचनात्मक संभावनाओं का कितना विस्तार होगा।

आपके ध्यान देने के लिए धन्यवाद!

वसीली ए.

स्क्रिप्टम के बाद

यदि आपको लेख उपयोगी और जानकारीपूर्ण लगा, तो आप कृपया इसके विकास में योगदान देकर परियोजना का समर्थन कर सकते हैं। यदि आपको लेख पसंद नहीं आया, लेकिन आपके पास इसे बेहतर बनाने के बारे में विचार हैं, तो आपकी आलोचना को कम कृतज्ञता के साथ स्वीकार नहीं किया जाएगा।

कृपया याद रखें कि यह लेख कॉपीराइट के अधीन है। पुनर्मुद्रण और उद्धरण की अनुमति है बशर्ते कि स्रोत के लिए एक वैध लिंक हो, और उपयोग किए गए पाठ को किसी भी तरह से विकृत या संशोधित नहीं किया जाना चाहिए।

तरीकों का यह समूह इस तथ्य पर आधारित है कि प्रेषित सिग्नल गैर-रेखीय आयाम परिवर्तनों से गुजरते हैं, और संचारण और प्राप्त करने वाले हिस्सों में गैर-रैखिकताएं पारस्परिक होती हैं। उदाहरण के लिए, यदि ट्रांसमीटर में नॉनलाइनियर फ़ंक्शन Öu का उपयोग किया जाता है, तो रिसीवर में u 2 का उपयोग किया जाता है। पारस्परिक कार्यों का लगातार अनुप्रयोग यह सुनिश्चित करेगा कि समग्र परिवर्तन रैखिक बना रहे।

नॉनलाइनियर डेटा संपीड़न विधियों का विचार यह है कि ट्रांसमीटर आउटपुट सिग्नल के समान आयाम के साथ परिवर्तनों की एक बड़ी श्रृंखला संचारित कर सकता है पारित पैरामीटर(यानी, अधिक गतिशील रेंज)। डानामिक रेंज- यह सबसे बड़े अनुमेय सिग्नल आयाम और सबसे छोटे का अनुपात है, जो सापेक्ष इकाइयों या डेसिबल में व्यक्त किया गया है:

;	(2.17)
.	(2.18)

यू मिनट को कम करके गतिशील रेंज को बढ़ाने की स्वाभाविक इच्छा उपकरण की संवेदनशीलता और हस्तक्षेप और आत्म-शोर के बढ़ते प्रभाव से सीमित है।

अक्सर, गतिशील रेंज संपीड़न लघुगणक और पोटेंशिएशन के पारस्परिक कार्यों की एक जोड़ी का उपयोग करके किया जाता है। आयाम बदलने की पहली क्रिया कहलाती है COMPRESSION(संपीड़न द्वारा), दूसरा - विस्तार(खींचना)। इन विशेष कार्यों का चुनाव उनकी सबसे बड़ी संपीड़न क्षमताओं से जुड़ा है।

वहीं, इन तरीकों के नुकसान भी हैं। इनमें से पहला यह है कि छोटी संख्या का लघुगणक ऋणात्मक और सीमा में होता है:

अर्थात्, संवेदनशीलता बहुत अरेखीय है।

इन कमियों को कम करने के लिए, दोनों कार्यों को विस्थापन और सन्निकटन द्वारा संशोधित किया गया है। उदाहरण के लिए, टेलीफोन चैनलों के लिए अनुमानित फ़ंक्शन का रूप (प्रकार ए) है:

ए=87.6 के साथ। संपीड़न से लाभ 24 डीबी है।

नॉनलाइनियर प्रक्रियाओं का उपयोग करके डेटा संपीड़न को बड़ी त्रुटियों के साथ एनालॉग माध्यमों से कार्यान्वित किया जाता है। डिजिटल उपकरणों के उपयोग से रूपांतरण की सटीकता या गति में काफी सुधार हो सकता है। साथ ही धन का सीधा उपयोग कंप्यूटर प्रौद्योगिकी(अर्थात सीधे लघुगणक और घातांक की गणना करना) कम प्रदर्शन और संचयित गणना त्रुटियों के कारण सर्वोत्तम परिणाम नहीं देगा।

सटीकता सीमाओं के कारण, संपीड़न द्वारा डेटा संपीड़न का उपयोग गैर-महत्वपूर्ण मामलों में किया जाता है, उदाहरण के लिए, टेलीफोन और रेडियो चैनलों पर भाषण प्रसारित करने के लिए।

कुशल कोडिंग

कुशल कोड के. शैनन, फ़ानो और हफ़मैन द्वारा प्रस्तावित किए गए थे। कोड का सार यह है कि वे असमान होते हैं, यानी बिट्स की असमान संख्या के साथ, और कोड की लंबाई उसके घटित होने की संभावना के व्युत्क्रमानुपाती होती है। कुशल कोड की एक और बड़ी विशेषता यह है कि उन्हें सीमांकक की आवश्यकता नहीं होती है, अर्थात। विशेष वर्ण, आसन्न कोड संयोजनों को अलग करना। यह एक सरल नियम का पालन करके हासिल किया जाता है: छोटे कोड लंबे कोड की शुरुआत नहीं होते हैं। इस मामले में, बिट्स की निरंतर धारा को विशिष्ट रूप से डिकोड किया जाता है क्योंकि डिकोडर पहले छोटे कोडवर्ड का पता लगाता है। कुशल कोड लंबे समय से विशुद्ध रूप से अकादमिक रहे हैं, लेकिन हाल ही में उनका उपयोग डेटाबेस बनाने के साथ-साथ आधुनिक मॉडेम और सॉफ्टवेयर आर्काइवर्स में जानकारी को संपीड़ित करने में सफलतापूर्वक किया गया है।

असमानता के कारण, औसत कोड लंबाई पेश की गई है। औसत लंबाई - कोड लंबाई की गणितीय अपेक्षा:

इसके अलावा, l av ऊपर से H(x) की ओर प्रवृत्त होता है (अर्थात्, l av > H(x))।

N बढ़ने पर शर्त (2.23) की पूर्ति मजबूत हो जाती है।

कुशल कोड दो प्रकार के होते हैं: शैनन-फ़ानो और हफ़मैन। आइए एक उदाहरण का उपयोग करके देखें कि उन्हें कैसे प्राप्त किया जाए। आइए मान लें कि अनुक्रम में प्रतीकों की संभावनाओं में तालिका 2.1 में दिए गए मान हैं।

तालिका 2.1.

प्रतीक सम्भावनाएँ

एन
पी मैं	0.1	0.2	0.1	0.3	0.05	0.15	0.03	0.02	0.05

प्रतीकों को क्रमबद्ध किया जाता है, अर्थात संभावनाओं के घटते क्रम में एक पंक्ति में प्रस्तुत किया जाता है। इसके बाद, शैनन-फ़ानो पद्धति का उपयोग करते हुए, निम्नलिखित प्रक्रिया को समय-समय पर दोहराया जाता है: घटनाओं के पूरे समूह को समान (या लगभग समान) कुल संभावनाओं वाले दो उपसमूहों में विभाजित किया जाता है। प्रक्रिया तब तक जारी रहती है जब तक कि एक तत्व अगले उपसमूह में न रह जाए, जिसके बाद यह तत्व समाप्त हो जाता है, और शेष के साथ निर्दिष्ट क्रियाएं जारी रहती हैं। ऐसा तब तक होता है जब तक कि अंतिम दो उपसमूहों में केवल एक तत्व शेष न रह जाए। आइए अपने उदाहरण को जारी रखें, जिसे तालिका 2.2 में संक्षेपित किया गया है।

तालिका 2.2.

शैनन-फ़ानो कोडिंग

एन	पी मैं
4	0.3		मैं
	0.2	मैं	द्वितीय
6	0.15		मैं	मैं
	0.1			द्वितीय
1	0.1			मैं	मैं
9	0.05	द्वितीय			द्वितीय
5	0.05		द्वितीय		मैं
7	0.03			द्वितीय	द्वितीय	मैं
8	0.02					द्वितीय

जैसा कि तालिका 2.2 से देखा जा सकता है, प्रायिकता पी 4 = 0.3 वाला पहला प्रतीक समूहों में विभाजित करने की दो प्रक्रियाओं में भाग लिया और दोनों बार समूह संख्या I में समाप्त हुआ। इसके अनुसार, इसे दो अंकों वाले कोड II के साथ एन्कोड किया गया है। विभाजन के पहले चरण में दूसरा तत्व समूह I से संबंधित था, दूसरे में - समूह II से। इसलिए, इसका कोड 10 है। शेष प्रतीकों के कोड को अतिरिक्त टिप्पणियों की आवश्यकता नहीं है।

आमतौर पर, गैर-समान कोड को कोड ट्री के रूप में दर्शाया जाता है। कोड ट्री एक ग्राफ़ है जो अनुमत कोड संयोजनों को दर्शाता है। इस ग्राफ़ के किनारों की दिशाएँ पूर्व-निर्धारित हैं, जैसा कि चित्र 2.11 में दिखाया गया है (दिशाओं का चुनाव मनमाना है)।

वे ग्राफ़ को इस प्रकार नेविगेट करते हैं: चयनित प्रतीक के लिए एक मार्ग बनाएं; इसके लिए बिट्स की संख्या मार्ग में किनारों की संख्या के बराबर है, और प्रत्येक बिट का मान संबंधित किनारे की दिशा के बराबर है। मार्ग प्रारंभिक बिंदु से बनाया गया है (चित्र में इसे अक्षर ए से चिह्नित किया गया है)। उदाहरण के लिए, शीर्ष 5 तक जाने वाले मार्ग में पाँच किनारे होते हैं, जिनमें से अंतिम को छोड़कर सभी की दिशा 0 होती है; हमें कोड 00001 मिलता है।

आइए इस उदाहरण के लिए एन्ट्रापी और औसत शब्द लंबाई की गणना करें।

एच(एक्स) = -(0.3 लॉग 0.3 + 0.2 लॉग 0.2 + 2 0.1 लॉग 0.1+ 2 0.05 लॉग 0.05+

0.03 लॉग 0.03 + 0.02 लॉग 0.02) = 2.23 बिट्स

एल औसत = 0.3 2 + 0.2 2 + 0.15 3 + 0.1 3 + 0.1 4 + 0.05 5 +0.05 4+

0.03 6 + 0.02 6 = 2.9 .

जैसा कि आप देख सकते हैं, औसत शब्द लंबाई एन्ट्रापी के करीब है।

हफ़मैन कोड एक अलग एल्गोरिदम का उपयोग करके बनाए गए हैं। कोडिंग प्रक्रिया में दो चरण होते हैं। पहले चरण में, वर्णमाला का एकल संकुचन क्रमिक रूप से किया जाता है। एक बार का संपीड़न - अंतिम दो प्रतीकों (न्यूनतम संभावनाओं के साथ) को कुल संभावना के साथ एक के साथ बदलना। संपीड़न तब तक किया जाता है जब तक दो अक्षर शेष न रह जाएं। उसी समय, एक कोडिंग तालिका भरी जाती है, जिसमें परिणामी संभावनाएं दर्ज की जाती हैं, और उन मार्गों को दर्शाया जाता है जिनके साथ अगले चरण में नए प्रतीक चलते हैं।

दूसरे चरण में, वास्तविक एन्कोडिंग होती है, जो अंतिम चरण से शुरू होती है: दो प्रतीकों में से पहले को कोड 1 सौंपा गया है, दूसरे को - 0. इसके बाद, वे पिछले चरण पर चले जाते हैं। जिन प्रतीकों ने इस चरण में संपीड़न में भाग नहीं लिया, उन्हें अगले चरण से कोड सौंपा गया है, और ग्लूइंग के बाद प्राप्त प्रतीक का कोड अंतिम दो प्रतीकों को दो बार सौंपा गया है और कोड में जोड़ा गया है शीर्ष पात्र 1, निचला वाला - 0. यदि प्रतीक आगे ग्लूइंग में शामिल नहीं है, तो इसका कोड अपरिवर्तित रहता है। प्रक्रिया अंत तक (अर्थात् प्रथम चरण तक) चलती रहती है।

तालिका 2.3 हफ़मैन कोडिंग दिखाती है। जैसा कि तालिका से देखा जा सकता है, कोडिंग 7 चरणों में की गई थी। बाईं ओर प्रतीक संभावनाएं हैं, दाईं ओर मध्यवर्ती कोड हैं। तीर नवगठित प्रतीकों की गतिविधियों को दर्शाते हैं। प्रत्येक चरण में, अंतिम दो प्रतीक केवल कम से कम महत्वपूर्ण बिट में भिन्न होते हैं, जो एन्कोडिंग तकनीक से मेल खाता है। आइए औसत शब्द लंबाई की गणना करें:

एल औसत = 0.3 2 + 0.2 2 + 0.15 3 ++ 2 0.1 3 + +0.05 4 + 0.05 5 + 0.03 6 + 0.02 6 = 2.7

यह एन्ट्रापी के और भी करीब है: कोड और भी अधिक कुशल है। चित्र में. चित्र 2.12 हफ़मैन कोड ट्री दिखाता है।

तालिका 2.3.

हफ़मैन कोडिंग

एन	पी मैं	कोड	मैं	द्वितीय	तृतीय	चतुर्थ	वी	छठी	सातवीं
	0.3		0.3 11	0.3 11	0.3 11	0.3 11	0.3 11	0.4 0	0.6 1
	0.2		0.2 01	0.2 01	0.2 01	0.2 01	0.3 10	0.3 11	0.4 0
	0.15		0.15 101	0.15 101	0.15 101	0.2 00	0.2 01	0.3 10
	0.1		0.1 001	0.1 001	0.15 100	0.15 101	0.2 00
	0.1		0.1 000	0.1 000	0.1 001	0.15 100
	0.05		0.05 1000	0.1 1001	0.1 000
	0.05		0.05 10011	0.05 1000
	0.03		0.05 10010
	0.02

दोनों कोड स्पष्ट डिकोडिंग की आवश्यकता को पूरा करते हैं: जैसा कि तालिकाओं से देखा जा सकता है, छोटे संयोजन लंबे कोड की शुरुआत नहीं हैं।

जैसे-जैसे वर्णों की संख्या बढ़ती है, कोड की दक्षता बढ़ती है, इसलिए कुछ मामलों में बड़े ब्लॉकों को एन्कोड किया जाता है (उदाहरण के लिए, यदि हम ग्रंथों के बारे में बात कर रहे हैं, तो कुछ सबसे अधिक बार आने वाले अक्षरों, शब्दों और यहां तक कि वाक्यांशों को एन्कोड किया जा सकता है)।

ऐसे कोड पेश करने का प्रभाव एक समान कोड के साथ तुलना करके निर्धारित किया जाता है:

(2.24)

जहां n एकसमान कोड के बिट्स की संख्या है जिसे प्रभावी कोड द्वारा प्रतिस्थापित किया जाता है।

हफ़मैन कोड का संशोधन

क्लासिक हफ़मैन एल्गोरिथम एक दो-पास एल्गोरिथम है, अर्थात। पहले प्रतीकों और संदेशों पर आँकड़े एकत्र करने की आवश्यकता है, और फिर ऊपर वर्णित प्रक्रियाओं की। व्यवहार में यह असुविधाजनक है क्योंकि इससे संदेशों को संसाधित करने और शब्दकोश जमा करने में लगने वाला समय बढ़ जाता है। अधिक बार, एक-पास विधियों का उपयोग किया जाता है, जिसमें संचय और एन्कोडिंग प्रक्रियाएं संयुक्त होती हैं। हफ़मैन [46] के अनुसार ऐसी विधियों को अनुकूली संपीड़न भी कहा जाता है।

हफ़मैन के अनुसार अनुकूली संपीड़न का सार एक प्रारंभिक कोड ट्री के निर्माण और प्रत्येक अगले प्रतीक के आने के बाद उसके अनुक्रमिक संशोधन में आता है। पहले की तरह, यहाँ के पेड़ द्विआधारी हैं, अर्थात्। वृक्ष ग्राफ़ के प्रत्येक शीर्ष से अधिकतम दो चाप निकलते हैं। मूल शीर्ष को मूल शीर्ष और उससे जुड़े दो अनुवर्ती शीर्षों को संतान कहने की प्रथा है। आइए शीर्ष भार की अवधारणा का परिचय दें - यह किसी दिए गए शीर्ष के अनुरूप वर्णों (शब्दों) की संख्या है, जो मूल अनुक्रम को खिलाते समय प्राप्त होती है। जाहिर है, बच्चों के वजन का योग माता-पिता के वजन के बराबर होता है।

इनपुट अनुक्रम के अगले प्रतीक को पेश करने के बाद, कोड ट्री को संशोधित किया जाता है: शीर्षों के वजन की पुनर्गणना की जाती है और, यदि आवश्यक हो, तो शीर्षों को पुन: व्यवस्थित किया जाता है। शीर्षों को क्रमपरिवर्तित करने का नियम इस प्रकार है: निचले शीर्षों का भार सबसे छोटा होता है, और ग्राफ़ के बाईं ओर स्थित शीर्षों का भार सबसे कम होता है।

उसी समय, शीर्षों को क्रमांकित किया जाता है। क्रमांकन निचले (लटके हुए, यानी, जिनके कोई बच्चे नहीं हैं) शीर्ष से बाएं से दाएं शुरू होता है, फिर आगे बढ़ता है उच्चे स्तर कावगैरह। अंतिम, मूल शीर्ष को क्रमांकित करने से पहले। इस मामले में, निम्नलिखित परिणाम प्राप्त होता है: शीर्ष का वजन जितना कम होगा, उसकी संख्या उतनी ही कम होगी।

क्रमपरिवर्तन मुख्य रूप से लटके हुए शीर्षों के लिए किया जाता है। क्रमपरिवर्तन करते समय, ऊपर दिए गए नियम को ध्यान में रखा जाना चाहिए: अधिक वजन वाले शीर्षों की संख्या अधिक होती है।

अनुक्रम पारित करने के बाद (इसे नियंत्रण या परीक्षण भी कहा जाता है), सभी लटके हुए शीर्षों को कोड संयोजन सौंपा गया है। कोड निर्दिष्ट करने का नियम उपरोक्त के समान है: कोड के बिट्स की संख्या शीर्षों की संख्या के बराबर होती है जिसके माध्यम से मार्ग स्रोत से दिए गए लटकते शीर्ष तक जाता है, और एक विशेष बिट का मान दिशा से मेल खाता है माता-पिता से "बच्चे" तक (मान लीजिए, माता-पिता के बाईं ओर जाना मान 1 से मेल खाता है, दाईं ओर - 0)।

परिणामी कोड संयोजन उनके एनालॉग्स के साथ संपीड़न डिवाइस की मेमोरी में संग्रहीत होते हैं और एक शब्दकोश बनाते हैं। एल्गोरिदम का उपयोग इस प्रकार है. वर्णों के संपीड़ित अनुक्रम को मौजूदा शब्दकोश के अनुसार टुकड़ों में विभाजित किया गया है, जिसके बाद प्रत्येक टुकड़े को शब्दकोश से उसके कोड के साथ बदल दिया जाता है। शब्दकोष में न पाए जाने वाले अंश नए लटकते शीर्ष बनाते हैं, वजन प्राप्त करते हैं और शब्दकोष में भी दर्ज हो जाते हैं। इस प्रकार, शब्दकोश को पुनः भरने के लिए एक अनुकूली एल्गोरिदम बनता है।

विधि की दक्षता बढ़ाने के लिए, शब्दकोश का आकार बढ़ाना वांछनीय है; इस स्थिति में संपीड़न अनुपात बढ़ जाता है। व्यवहार में, शब्दकोश का आकार 4 - 16 KB मेमोरी का होता है।

आइए दिए गए एल्गोरिदम को एक उदाहरण से स्पष्ट करें। चित्र में. चित्र 2.13 मूल आरेख दिखाता है (इसे हफ़मैन वृक्ष भी कहा जाता है)। पेड़ के प्रत्येक शीर्ष को एक आयत द्वारा दर्शाया गया है जिसमें दो संख्याएँ एक अंश के माध्यम से अंकित हैं: पहले का अर्थ शीर्ष की संख्या है, दूसरे का अर्थ उसका वजन है। जैसा कि आप देख सकते हैं, शीर्षों के भार और उनकी संख्या के बीच पत्राचार संतुष्ट है।

आइए अब मान लें कि शीर्ष 1 से संबंधित प्रतीक परीक्षण अनुक्रम में दूसरी बार दिखाई देता है। चित्र में दिखाए अनुसार शीर्ष का भार बदल गया है। 2.14, जिसके परिणामस्वरूप शीर्ष क्रमांकन के नियम का उल्लंघन होता है। अगले चरण में, हम लटके हुए शीर्षों का स्थान बदलते हैं, जिसके लिए हम शीर्ष 1 और 4 की अदला-बदली करते हैं और पेड़ के सभी शीर्षों को पुनः क्रमांकित करते हैं। परिणामी ग्राफ चित्र में दिखाया गया है। 2.15. फिर प्रक्रिया वैसे ही चलती रहती है.

यह याद रखना चाहिए कि हफ़मैन पेड़ में प्रत्येक लटकता हुआ शीर्ष एक विशिष्ट प्रतीक या प्रतीकों के समूह से मेल खाता है। माता-पिता अपने बच्चों से इस मायने में भिन्न होते हैं कि उनके अनुरूप प्रतीकों का समूह उनके बच्चों से एक प्रतीक छोटा होता है, और ये बच्चे अंतिम प्रतीक में भिन्न होते हैं। उदाहरण के लिए, प्रतीक "कार" मूल से मेल खाते हैं; तब बच्चों के पास "कारा" और "कार्प" क्रम हो सकते हैं।

दिया गया एल्गोरिदम अकादमिक नहीं है और ग्राफिक डेटा को संपीड़ित करने सहित संग्रह कार्यक्रमों में सक्रिय रूप से उपयोग किया जाता है (उन पर नीचे चर्चा की जाएगी)।

लेम्पेल-ज़िव एल्गोरिदम

ये आज सबसे अधिक उपयोग किए जाने वाले संपीड़न एल्गोरिदम हैं। इनका उपयोग अधिकांश संग्रह कार्यक्रमों में किया जाता है (उदाहरण के लिए, PKZIP. ARJ, LHA)। एल्गोरिदम का सार यह है कि संग्रह के दौरान प्रतीकों के एक निश्चित सेट को विशेष रूप से तैयार किए गए शब्दकोश में उसकी संख्या से बदल दिया जाता है। उदाहरण के लिए, वाक्यांश "आपके पत्र के लिए आउटगोइंग नंबर...", जो अक्सर व्यावसायिक पत्राचार में पाया जाता है, शब्दकोश में 121 स्थान पर हो सकता है; फिर, उल्लिखित वाक्यांश (30 बाइट्स) को प्रसारित या संग्रहीत करने के बजाय, आप वाक्यांश संख्या (बाइनरी दशमलव रूप में 1.5 बाइट्स या बाइनरी में 1 बाइट) संग्रहीत कर सकते हैं।

एल्गोरिदम का नाम उन लेखकों के नाम पर रखा गया है जिन्होंने पहली बार उन्हें 1977 में प्रस्तावित किया था। इनमें से पहला है LZ77. संग्रह करने के लिए, एक तथाकथित संदेश स्लाइडिंग विंडो बनाई जाती है, जिसमें दो भाग होते हैं। पहला भाग, एक बड़ा प्रारूप, एक शब्दकोश बनाने का काम करता है और इसका आकार लगभग कई किलोबाइट है। दूसरा, छोटा भाग (आमतौर पर आकार में 100 बाइट्स तक) देखे जा रहे पाठ के वर्तमान वर्ण प्राप्त करता है। एल्गोरिदम शब्दकोश में वर्णों का एक सेट ढूंढने का प्रयास करता है जो देखने वाली विंडो में प्राप्त वर्णों से मेल खाता है। यदि यह सफल होता है, तो एक कोड उत्पन्न होता है जिसमें तीन भाग होते हैं: शब्दकोश में इसके प्रारंभिक सबस्ट्रिंग के सापेक्ष ऑफसेट, इस सबस्ट्रिंग की लंबाई, और इस सबस्ट्रिंग के बाद का वर्ण। उदाहरण के लिए, चयनित सबस्ट्रिंग में "ऐप" अक्षर (कुल 6 अक्षर) शामिल हैं, अगला अक्षर "ई" है। फिर, यदि सबस्ट्रिंग का पता (शब्दकोश में स्थान) 45 है, तो शब्दकोश में प्रविष्टि "45, 6. ई" जैसी दिखती है। इसके बाद, विंडो की सामग्री को स्थिति के अनुसार स्थानांतरित कर दिया जाता है, और खोज जारी रहती है। इस प्रकार शब्दकोश बनता है।

एल्गोरिथम का लाभ शब्दकोश संकलित करने के लिए आसानी से औपचारिक रूप से तैयार किया जाने वाला एल्गोरिथम है। इसके अलावा, मूल शब्दकोश के बिना अनज़िप करना संभव है (परीक्षण अनुक्रम रखने की सलाह दी जाती है) - शब्दकोश अनज़िप करने के दौरान बनता है।

शब्दकोश का आकार बढ़ने पर एल्गोरिथम के नुकसान सामने आते हैं - खोज का समय बढ़ता है। इसके अलावा, यदि वर्तमान विंडो में वर्णों की एक स्ट्रिंग दिखाई देती है जो शब्दकोश में नहीं है, तो प्रत्येक वर्ण को तीन-तत्व कोड के साथ लिखा जाता है, अर्थात। परिणाम संपीड़न नहीं, बल्कि खिंचाव है।

1978 में प्रस्तावित LZSS एल्गोरिथम में सर्वोत्तम विशेषताएं हैं। इसमें स्लाइडिंग विंडो सपोर्ट और कंप्रेसर आउटपुट कोड में अंतर है। विंडो के अलावा, एल्गोरिदम मैचों की खोज को तेज करने के लिए हफ़मैन ट्री के समान एक बाइनरी ट्री उत्पन्न करता है: वर्तमान विंडो को छोड़ने वाले प्रत्येक सबस्ट्रिंग को बच्चों में से एक के रूप में ट्री में जोड़ा जाता है। यह एल्गोरिदम आपको वर्तमान विंडो के आकार को और बढ़ाने की अनुमति देता है (यह वांछनीय है कि इसका आकार दो की शक्ति के बराबर हो: 128, 256, आदि बाइट्स)। अनुक्रम कोड भी अलग तरीके से बनाए जाते हैं: "ऑफ़सेट, लंबाई" जोड़े से अनकोडेड वर्णों को अलग करने के लिए एक अतिरिक्त 1-बिट उपसर्ग पेश किया जाता है।

LZW जैसे एल्गोरिदम का उपयोग करने पर संपीड़न की और भी अधिक डिग्री प्राप्त होती है। पहले वर्णित एल्गोरिदम में एक निश्चित विंडो आकार होता है, जिससे विंडो आकार से अधिक लंबे वाक्यांशों को शब्दकोश में दर्ज करना असंभव हो जाता है। LZW एल्गोरिदम (और उनके पूर्ववर्ती LZ78) में, देखने वाली विंडो का आकार असीमित होता है, और शब्दकोश वाक्यांशों को जमा करता है (और पहले की तरह वर्णों का संग्रह नहीं)। शब्दकोश की लंबाई असीमित है, और एनकोडर (डिकोडर) वाक्यांश प्रतीक्षा मोड में काम करता है। जब शब्दकोश से मेल खाने वाला कोई वाक्यांश बनता है, तो एक मिलान कोड जारी किया जाता है (यानी, शब्दकोश में इस वाक्यांश का कोड) और उसके बाद वाले वर्ण का कोड जारी किया जाता है। यदि, प्रतीकों के जमा होने पर, एक नया वाक्यांश बनता है, तो इसे भी छोटे वाक्यांश की तरह, शब्दकोश में दर्ज किया जाता है। परिणाम एक पुनरावर्ती प्रक्रिया है जो तेज़ एन्कोडिंग और डिकोडिंग प्रदान करती है।

अतिरिक्त अवसरसंपीड़न दोहराए गए वर्णों की संपीड़ित एन्कोडिंग प्रदान करता है। यदि किसी अनुक्रम में कुछ वर्ण एक पंक्ति में आते हैं (उदाहरण के लिए, पाठ में ये "स्पेस" वर्ण हो सकते हैं, संख्या अनुक्रम में - लगातार शून्य, आदि), तो उन्हें जोड़ी "वर्ण" के साथ प्रतिस्थापित करना समझ में आता है; लंबाई" या "चिह्न, लंबाई" "। पहले मामले में, कोड संकेत को इंगित करता है कि अनुक्रम एन्कोड किया जाएगा (आमतौर पर 1 बिट), फिर दोहराए जाने वाले चरित्र का कोड और अनुक्रम की लंबाई। दूसरे मामले में (सबसे अधिक बार दोहराए जाने वाले वर्णों के लिए प्रदान किया गया), उपसर्ग केवल एक पुनरावृत्ति संकेत को इंगित करता है।

जो लोग होम ऑडियो के शौकीन हैं वे एक दिलचस्प विरोधाभास प्रदर्शित करते हैं। वे सुनने के कमरे में फावड़ा चलाने, विदेशी ड्राइवरों के साथ स्पीकर बनाने के लिए तैयार हैं, लेकिन डिब्बाबंद संगीत के सामने शर्म से पीछे हट जाते हैं, जैसे लाल झंडे के सामने भेड़िया। लेकिन वास्तव में, आप झंडे के लिए खड़े क्यों नहीं हो सकते और डिब्बाबंद भोजन से कुछ और खाद्य पकाने की कोशिश क्यों नहीं कर सकते?

समय-समय पर, मंच पर वादी प्रश्न उठते हैं: "अच्छी तरह से रिकॉर्ड किए गए एल्बम की अनुशंसा करें।" ये बात समझ में आती है. विशेष ऑडियोफ़ाइल प्रकाशन, हालांकि वे पहले मिनट के लिए कानों को प्रसन्न करते हैं, अंत तक कोई उनकी बात नहीं सुनता, प्रदर्शनों की सूची बहुत नीरस है। जहाँ तक बाकी संगीत पुस्तकालय का सवाल है, समस्या स्पष्ट प्रतीत होती है। आप बचत कर सकते हैं, या आप बचत नहीं कर सकते हैं और घटकों में ढेर सारा पैसा डाल सकते हैं। फिर भी, कुछ लोग अपने पसंदीदा संगीत को तेज़ आवाज़ में सुनना पसंद करते हैं और एम्पलीफायर की क्षमताओं का इससे कोई लेना-देना नहीं है।

आज, हाई-रेज एल्बम में भी, साउंडट्रैक के शीर्ष को काट दिया जाता है और वॉल्यूम को क्लिपिंग में बदल दिया जाता है। ऐसा माना जाता है कि बहुसंख्यक लोग सभी प्रकार के कबाड़ पर संगीत सुनते हैं, और इसलिए एक प्रकार की जोरदार क्षतिपूर्ति करने के लिए "गैस पर कदम रखना" आवश्यक है।

बेशक, यह ऑडियोफाइल्स को परेशान करने के उद्देश्य से नहीं किया गया है। बहुत कम लोग उन्हें याद रखते हैं। शायद उन्होंने उन्हें मास्टर फ़ाइलें देने के बारे में सोचा था जिनसे मुख्य सर्कुलेशन की प्रतिलिपि बनाई जाती है - सीडी, एमपी3, आदि। बेशक, मास्टर लंबे समय से एक कंप्रेसर द्वारा चपटा हुआ है; कोई भी जानबूझकर एचडी ट्रैक्स के लिए विशेष संस्करण तैयार नहीं करेगा। जब तक कि विनाइल मीडिया के लिए एक निश्चित प्रक्रिया नहीं अपनाई जाती, जो इस कारण से अधिक मानवीय लगती है। और डिजिटल मार्ग के लिए, यह सब उसी तरह समाप्त होता है - एक बड़े मोटे कंप्रेसर के साथ।

तो, वर्तमान में, 100% प्रकाशित फोनोग्राम, शास्त्रीय संगीत को छोड़कर, मास्टरिंग के दौरान संपीड़न के अधीन हैं। कुछ लोग इस प्रक्रिया को कमोबेश कुशलता से करते हैं, जबकि अन्य इसे पूरी तरह से मूर्खतापूर्ण ढंग से करते हैं। नतीजतन, हमारे पास मंचों पर तीर्थयात्री हैं जिनके पास डीआर प्लगइन्स की एक श्रृंखला है, संस्करणों की दर्दनाक तुलनाएं हैं, विनाइल की उड़ान है, जहां हमें पहले प्रेस को माइन करने की भी आवश्यकता है।

इन सभी आक्रोशों को देखकर सबसे अधिक निराश व्यक्ति वस्तुतः ऑडियो शैतानवादियों में बदल गया। कोई मज़ाक नहीं, वे साउंड इंजीनियर के पवित्र ग्रंथ को उल्टा पढ़ रहे हैं! आधुनिक ऑडियो संपादन कार्यक्रमों में क्लिप की गई ध्वनि तरंग को पुनर्स्थापित करने के लिए कुछ उपकरण होते हैं।

प्रारंभ में, यह कार्यक्षमता स्टूडियो के लिए थी। मिश्रण करते समय, ऐसी स्थितियाँ होती हैं जब क्लिपिंग को रिकॉर्डिंग में शामिल किया जाता है, और कई कारणों से सत्र को फिर से करना संभव नहीं होता है, और यहाँ एक ऑडियो संपादक का शस्त्रागार बचाव के लिए आता है - एक डिक्लिपर, एक डीकंप्रेसर, आदि .

और अब सामान्य श्रोता, जिनके कान अगले नए उत्पाद के बाद खून बह रहे हैं, ऐसे सॉफ्टवेयर तक अधिक से अधिक साहसपूर्वक पहुंच रहे हैं। कुछ लोग iZotope पसंद करते हैं, अन्य Adobe ऑडिशन पसंद करते हैं, अन्य लोग संचालन को कई कार्यक्रमों के बीच विभाजित करते हैं। पिछली गतिशीलता को बहाल करने का उद्देश्य क्लिप किए गए सिग्नल शिखर को प्रोग्रामेटिक रूप से ठीक करना है, जो 0 डीबी पर आराम करते हुए, एक गियर जैसा दिखता है।

हां, स्रोत कोड के 100% पुनरुद्धार की कोई बात नहीं है, क्योंकि इंटरपोलेशन प्रक्रियाएं सट्टा एल्गोरिदम का उपयोग करके होती हैं। लेकिन फिर भी, कुछ प्रसंस्करण परिणाम मुझे दिलचस्प और अध्ययन के योग्य लगे।

उदाहरण के लिए, लाना डेल रे का एल्बम "लस्ट फॉर लाइफ", लगातार गालियाँ, उह, गालियाँ! मूल गीत "व्हेन द वर्ल्ड वाज़ एट वॉर वी केप्ट डांसिंग" इस प्रकार था।

और डिक्लिपर्स और डीकंप्रेसर्स की एक श्रृंखला के बाद यह इस तरह हो गया। डीआर गुणांक 5 से बदलकर 9 हो गया है। आप प्रसंस्करण से पहले और बाद में नमूना डाउनलोड और सुन सकते हैं।

मैं यह नहीं कह सकता कि यह विधि सार्वभौमिक है और सभी बर्बाद एल्बमों के लिए उपयुक्त है, लेकिन इस मामले में मैंने आधिकारिक 24-बिट संस्करण के बजाय रूट ट्रैकर कार्यकर्ता द्वारा संसाधित इस संस्करण को संग्रह में रखना चुना।

भले ही ध्वनि सामग्री से कृत्रिम रूप से चोटियां निकालने से संगीत प्रदर्शन की वास्तविक गतिशीलता वापस नहीं आती है, फिर भी आपका डीएसी आपको धन्यवाद देगा। आख़िरकार, उसके लिए चरम स्तरों पर त्रुटियों के बिना काम करना बहुत मुश्किल था, जहाँ तथाकथित अंतर-नमूना शिखर (आईएसपी) होने की उच्च संभावना है। और अब सिग्नल की केवल दुर्लभ चमक 0 डीबी तक पहुंच जाएगी। इसके अलावा, एक मूक साउंडट्रैक जब FLAC या किसी अन्य दोषरहित कोडेक में संपीड़ित किया जाएगा तो उसका आकार छोटा हो जाएगा। सिग्नल में अधिक "वायु" हार्ड ड्राइव स्थान बचाता है।

अपने सबसे अधिक नफरत वाले एल्बमों को पुनर्जीवित करने का प्रयास करें जो "ज़ोर युद्ध" में नष्ट हो गए थे। गतिशीलता को आरक्षित करने के लिए, आपको पहले ट्रैक स्तर को -6 डीबी तक कम करना होगा, और फिर डिक्लिपर चलाना होगा। जो लोग कंप्यूटर पर भरोसा नहीं करते हैं वे सीडी प्लेयर और एम्पलीफायर के बीच एक स्टूडियो विस्तारक प्लग कर सकते हैं। यह डिवाइसअनिवार्य रूप से वही काम करता है - यह गतिशील रूप से संपीड़ित ऑडियो सिग्नल की चोटियों को यथासंभव सर्वोत्तम रूप से पुनर्स्थापित और फैलाता है। 80-90 के दशक के समान उपकरण बहुत महंगे नहीं हैं, और प्रयोग के तौर पर इन्हें आज़माना बहुत दिलचस्प होगा।

DBX 3BX डायनेमिक रेंज कंट्रोलर सिग्नल को तीन बैंड - LF, MF और HF में अलग से प्रोसेस करता है

एक समय, इक्वलाइज़र ऑडियो सिस्टम का एक अनिवार्य घटक था, और कोई भी उनसे डरता नहीं था। आज चुंबकीय टेप के उच्च-आवृत्ति रोल को समतल करने की कोई आवश्यकता नहीं है, लेकिन भाइयों, बदसूरत गतिशीलता के बारे में कुछ करने की आवश्यकता है।