„Kodierung von Audioinformationen. Audiokodierung Minimale und maximale Klangqualität

💖 Gefällt es dir? Teilen Sie den Link mit Ihren Freunden

Ziele:

lehrreich:

  • Machen Sie sich mit der Technologie der binären Kodierung von WAV-Dateien vertraut
  • Erfahren Sie, wie Sie Probleme lösen, um die Größe einer WAV-Audiodatei zu bestimmen

Zeitabtastung - ein Prozess, bei dem während der Codierung eines kontinuierlichen Tonsignal Dabei wird die Schallwelle in einzelne kleine Zeitabschnitte unterteilt und für jeden dieser Abschnitte ein bestimmter Amplitudenwert eingestellt. Je größer die Amplitude des Signals, desto lauter der Ton.

Audiotiefe (Kodierungstiefe) –Anzahl der Bits pro Audiokodierung.

Lautstärkepegel (Signalpegel)- Der Ton kann unterschiedliche Lautstärken haben. Die Anzahl der verschiedenen Lautstärkestufen wird anhand der Formel berechnet N= 2 ICH WoICH- Klangtiefe.

Abtastfrequenz - Anzahl der Messungen des Eingangssignalpegels pro Zeiteinheit (pro 1 Sekunde). Je höher die Abtastrate, desto genauer ist das binäre Kodierungsverfahren. Die Frequenz wird in Hertz (Hz) gemessen. 1 Messung pro 1 Sekunde -1 Hz.

1000 Messungen in 1 Sekunde 1 kHz. Bezeichnen wir die Abtastrate mit dem BuchstabenD. Wählen Sie zur Kodierung eine von drei Frequenzen:44,1 kHz, 22,05 kHz, 11,025 kHz.

Es wird angenommen, dass der Frequenzbereich, den eine Person hört, aus dem Frequenzbereich stammt 20 Hz bis 20 kHz.

Qualität der Binärkodierung -ein Wert, der durch die Kodierungstiefe und die Abtastfrequenz bestimmt wird.

Audioadapter (Soundkarte) - ein Gerät, das elektrische Schwingungen der Schallfrequenz in numerische Schwingungen umwandelt Binärcode bei der Toneingabe und zurück (von einem Zahlencode in elektrische Schwingungen) bei der Tonwiedergabe.

Spezifikationen des Audioadapters:Abtastfrequenz und Registerbittiefe.

Registergröße - Anzahl der Bits im Audioadapterregister. Je größer die Bittiefe, desto kleiner ist der Fehler jeder einzelnen Wertumrechnung elektrischer Strom zu einer Nummer und zurück. Wenn die Bittiefe ist ICH, dann kann bei der Messung das Eingangssignal 2 erhalten werdenICH = N unterschiedliche Bedeutungen.

Größe der digitalen Mono-Audiodatei (A) wird nach der Formel gemessen:

A= D* T* ICH/8 , WoD - Abtastfrequenz (Hz),T- Zeitpunkt der Tonwiedergabe oder -aufnahme,ICHRegisterbreite (Auflösung). Nach dieser Formel wird die Größe in Bytes gemessen.

Größe der digitalen Stereo-Audiodatei (A) wird nach der Formel gemessen:

A=2* D* T* ICH/8 , das Signal wird für zwei Lautsprecher aufgezeichnet, da der linke und der rechte Tonkanal getrennt codiert werden.

Für Schüler ist es hilfreich, Tabelle 1 anzugeben, zeigt an, wie viele MB die codierte Minute belegen wird Audioinformationen bei unterschiedlichen Abtastraten:

Algorithmus 1 (Berechnen Sie den Informationsumfang einer Sounddatei):

1) Finden Sie heraus, wie viele Gesamtwerte während der Wiedergabezeit der Datei in den Speicher eingelesen werden;

2) Ermitteln Sie die Codekapazität (wie viele Bits im Speicher jeder Messwert belegt);

3) Multiplizieren Sie die Ergebnisse;

4) Konvertieren Sie das Ergebnis in Bytes;

5) Konvertieren Sie das Ergebnis in K Bytes;

6) Konvertieren Sie das Ergebnis in M ​​Bytes;

Algorithmus 2 (Berechnen Sie die Spielzeit der Datei.)

1) Konvertieren Sie das Informationsvolumen der Datei in K Bytes.

2) Konvertieren Sie das Informationsvolumen der Datei in Bytes.

3) Wandeln Sie das Informationsvolumen der Datei in Bits um.

4) Finden Sie heraus, wie viele Werte gemessen wurden (Informationsvolumen in Bits geteilt durch die Bitlänge des Codes).

5) Berechnen Sie die Anzahl der Tonsekunden. (Dividieren Sie das vorherige Ergebnis durch die Abtastfrequenz.)

1. Größe der digitalen Datei

Stufe 3"

1. Bestimmen Sie die Größe (in Bytes) einer digitalen Audiodatei, deren Spielzeit 10 Sekunden bei einer Abtastrate von 22,05 kHz und einer Auflösung von 8 Bit beträgt. Die Datei ist nicht komprimiert.

Lösung:

Formel zur Berechnung der Größe (in Bytes) digitale Audiodatei: A= D* T* ICH/8.

Zur Konvertierung in Bytes muss der resultierende Wert durch 8 Bits geteilt werden.

22,05 kHz =22,05 * 1000 Hz =22050 Hz

A= D* T* ICH/8 = 22050 x 10 x 8 / 8 = 220500 Bytes.

Antwort: Die Dateigröße beträgt 220500 Bytes.

2. Bestimmen Sie die Speicherkapazität zum Speichern einer digitalen Audiodatei, deren Spielzeit zwei Minuten bei einer Abtastfrequenz von 44,1 kHz und einer Auflösung von 16 Bit beträgt.

Lösung:

A= D* T* ICH/8. - die Speicherkapazität zum Speichern einer digitalen Audiodatei.

44100 (Hz) x 120 (s) x 16 (Bits) / 8 (Bits) = 10584000 Bytes = 10335,9375 KB = 10,094 MB.

Antwort: ≈ 10 MB

Level 4"

3. Dem Benutzer steht eine Speicherkapazität von 2,6 MB zur Verfügung. Es ist erforderlich, eine digitale Audiodatei mit einer Tondauer von 1 Minute aufzunehmen. Wie hoch sollten die Abtastfrequenz und die Bittiefe sein?

Lösung:

Formel zur Berechnung der Abtastfrequenz und Bittiefe: D* I =A/T

(Speicherkapazität in Bytes) : (Erklingzeit in Sekunden):

2,6 MB = 2726297,6 Byte

D* I =A/T= 2726297,6 Bytes: 60 = 45438,3 Bytes

D=45438,3 Bytes: I

Die Adapterbreite kann 8 oder 16 Bit betragen. (1 Byte oder 2 Byte). Daher kann die Abtastfrequenz entweder 45438,3 Hz = 45,4 kHz ≈ betragen 44,1 kHz-Standard-charakteristische Abtastfrequenz oder 22719,15 Hz = 22,7 kHz ≈ 22,05 kHz- Standard-charakteristische Abtastrate

Antwort:

Abtastfrequenz

Kapazität des Audioadapters

1 Option

22,05 kHz

16 Bit

Option 2

44,1 kHz

8 Bit

4. Der freie Speicher auf der Festplatte beträgt 5,25 MB, die Bittiefe der Soundkarte beträgt 16. Wie lange dauert der Ton einer digitalen Audiodatei, die mit einer Abtastfrequenz von 22,05 kHz aufgenommen wurde?

Lösung:

Formel zur Berechnung der Schalldauer: T=A/D/I

(Speicherkapazität in Bytes): (Abtastfrequenz in Hz): (Soundkartenkapazität in Bytes):

5,25 MB = 5505024 Bytes

5505024 Bytes: 22050 Hz: 2 Bytes = 124,8 Sek
Antwort: 124,8 Sekunden

5. Eine Minute Aufnahme einer digitalen Audiodatei beansprucht 1,3 MB Speicherplatz, die Soundkarte hat eine Bitkapazität von 8. Mit welcher Abtastrate wird der Ton aufgenommen?

Lösung:

Formel zur Berechnung der Abtastrate: D = A/T/I

(Speicherkapazität in Bytes) : (Aufnahmezeit in Sekunden) : (Soundkartenkapazität in Bytes)

1,3 MB = 1363148,8 Byte

1363148,8 Bytes: 60:1 = 22719,1 Hz

Antwort: 22,05 kHz

6. Zwei Minuten Aufnahme einer digitalen Audiodatei beanspruchen 5,1 MB Speicherplatz. Abtastfrequenz - 22050 Hz. Welche Bittiefe hat der Audioadapter?

Lösung:

Formel zur Berechnung der Bittiefe: (Speicherkapazität in Bytes): (Erkundungszeit in Sekunden): (Abtastfrequenz):

5,1 MB = 5347737,6 Byte

5347737,6 Bytes: 120 Sek.: 22050 Hz = 2,02 Bytes = 16 Bits

Antwort: 16 Bit

7. Der freie Speicher auf der Festplatte beträgt 0,01 GB, die Bittiefe der Soundkarte beträgt 16. Wie lange dauert der Ton einer digitalen Audiodatei, die mit einer Abtastfrequenz von 44100 Hz aufgenommen wurde?

Lösung:

Formel zur Berechnung der Schalldauer T=A/D/I

(Speicherkapazität in Bytes) : (Abtastfrequenz in Hz) : (Soundkartenkapazität in Bytes)

0,01 GB = 10737418,24 Byte

10737418,24 Bytes: 44100: 2 = 121,74 Sek. = 2,03 Min
Antwort: 20,3 Minuten

8. Schätzen Sie den Informationsumfang einer Mono-Audiodatei mit einer Tondauer von 1 Minute. wenn die Kodierungstiefe und die Abtastfrequenz des Audiosignals gleich sind:
a) 16 Bit und 8 kHz;
b) 16 Bit und 24 kHz.

Lösung:

A).

16 Bit x 8.000 = 128.000 Bit = 16.000 Byte = 15,625 KB/s

15,625 KB/s x 60 s = 937,5 KB

B).
1) Die Informationslautstärke einer 1 Sekunde dauernden Tondatei ist gleich:
16 Bit x 24.000 = 384.000 Bit = 48.000 Byte = 46,875 KB/s
2) Die Informationslautstärke einer 1-minütigen Audiodatei beträgt:
46,875 KB/s x 60 s = 2812,5 KB = 2,8 MB

Antwort: a) 937,5 KB; b) 2,8 MB

Level 5"

Tabelle 1 wird verwendet

9. Wie viel Speicher wird benötigt, um eine digitale Audiodatei mit hochwertiger Tonaufnahme zu speichern, vorausgesetzt, die Spieldauer beträgt 3 Minuten?

Lösung:

Eine hohe Klangqualität wird bei einer Abtastfrequenz von 44,1 kHz und einer Audioadapter-Bittiefe von 16 erreicht.
Formel zur Berechnung der Speicherkapazität: (Aufnahmezeit in Sekunden) x (Soundkartenkapazität in Bytes) x (Abtastfrequenz):
180 s x 2 x 44100 Hz = 15876000 Bytes = 15,1 MB
Antwort: 15,1 MB

10. Die digitale Audiodatei enthält eine Audioaufnahme von schlechter Qualität (der Ton ist dunkel und gedämpft). Wie lange dauert eine Datei, wenn sie 650 KB groß ist?

Lösung:

Die folgenden Parameter sind typisch für düsteren und gedämpften Klang: Abtastfrequenz – 11,025 KHz, Bittiefe des Audioadapters – 8 Bit (siehe Tabelle 1). Dann ist T=A/D/I. Lassen Sie uns das Volumen in Bytes umrechnen: 650 KB = 665600 Bytes

Т=665600 Bytes/11025 Hz/1 Byte ≈60,4 s

Antwort: Die Dauer des Tons beträgt 60,5 s

Lösung:

Die Informationslautstärke einer 1 Sekunde dauernden Tondatei beträgt:
16 Bit x 48.000 x 2 = 1.536.000 Bit = 187,5 KB (multipliziert mit 2, da Stereo).

Die Informationsmenge einer Audiodatei von 1 Minute Dauer beträgt:
187,5 KB/s x 60 s ≈ 11 MB

Antwort: 11 MB

Antwort: a) 940 KB; b) 2,8 MB.

12. Berechnen Sie die Spielzeit einer Mono-Audiodatei, wenn ihre Lautstärke bei 16-Bit-Kodierung und einer Abtastfrequenz von 32 kHz gleich ist:
a) 700 KB;
b) 6300 KB

Lösung:

A).
1) Die Informationslautstärke einer 1 Sekunde dauernden Tondatei ist gleich:


700 KB: 62,5 KB/s = 11,2 s

B).
1) Die Informationslautstärke einer 1 Sekunde dauernden Tondatei ist gleich:
16 Bit x 32.000 = 512.000 Bit = 64.000 Byte = 62,5 KB/s
2) Die Abspielzeit einer 700 KB großen Mono-Audiodatei beträgt:
6300 KB: 62,5 KB/s = 100,8 s = 1,68 min

Antwort: a) 10 Sekunden; b) 1,5 Min.

13. Berechnen Sie, wie viele Informationsbytes eine Sekunde Stereoaufnahme auf einer CD einnimmt (Frequenz 44032 Hz, 16 Bit pro Wert). Wie lange dauert eine Minute? Wie hoch ist die maximale Festplattenkapazität (bei einer maximalen Dauer von 80 Minuten)?

Lösung:

Formel zur Berechnung der Speichergröße A= D* T* ICH:
(Aufnahmezeit in Sekunden) * (Soundkartenkapazität in Bytes) * (Abtastfrequenz). 16 Bits – 2 Bytes.
1) 1s x 2 x 44032 Hz = 88064 Bytes (1 Sekunde Stereo-CD-Aufnahme)
2) 60s x 2 x 44032 Hz = 5283840 Bytes (1 Minute Stereo-CD-Aufnahme)
3) 4800s x 2 x 44032 Hz = 422707200 Bytes = 412800 KB = 403,125 MB (80 Minuten)

Antwort: 88064 Bytes (1 Sekunde), 5283840 Bytes (1 Minute), 403,125 MB (80 Minuten)

2. Bestimmung der Klangqualität.

Um die Klangqualität zu bestimmen, müssen Sie die Abtastfrequenz ermitteln und Tabelle Nr. 1 verwenden

256 (2 8) Signalintensitätsstufen – Klangqualität von Radiosendungen, unter Verwendung von 65536 (2 16) Signalintensitätsstufen – Audio-CD-Klangqualität. Die Frequenz mit der höchsten Qualität entspricht der auf einer CD aufgenommenen Musik. Die Größe des analogen Signals wird in diesem Fall 44.100 Mal pro Sekunde gemessen.

Level 5"

13. Bestimmen Sie die Tonqualität (Rundfunkqualität, Durchschnittsqualität, Audio-CD-Qualität), wenn bekannt ist, dass die Lautstärke einer Mono-Audiodatei mit einer Tondauer von 10 Sekunden beträgt. gleich:
a) 940 KB;
b) 157 KB.

(, S. 76, Nr. 2.83)

Lösung:

A).
1) 940 KB = 962560 Byte = 7700480 Bit
2) 7700480 Bits: 10 Sek. = 770048 Bits/s
3) 770048 bps: 16 Bit = 48128 Hz – Abtastfrequenz – nahe der höchsten 44,1 kHz
Antwort: Audio-CD-Qualität

B).
1) 157 KB = 160768 Byte = 1286144 Bit
2) 1286144 Bits: 10 Sek. = 128614,4 Bits/s
3) 128614,4 bps: 16 Bit = 8038,4 Hz
Antwort: Sendequalität

Antwort: a) CD-Qualität; b) Qualität der Radiosendung.

14. Bestimmen Sie die Länge der Audiodatei, die auf eine 3,5-Zoll-Diskette passt. Bitte beachten Sie, dass auf einer solchen Diskette 2847 Sektoren mit 512 Bytes zum Speichern von Daten reserviert sind.
a) mit geringer Tonqualität: Mono, 8 Bit, 8 kHz;
b) wann gute Qualität Ton: Stereo, 16 Bit, 48 kHz.

(, S. 77, Nr. 2.85)

Lösung:

A).



8 Bit x 8.000 = 64.000 Bit = 8.000 Byte = 7,8 KB/s
3) Die Spielzeit einer Mono-Audiodatei mit einem Volumen von 1423,5 KB beträgt:
1423,5 KB: 7,8 KB/s = 182,5 s ≈ 3 Min

B).
1) Das Informationsvolumen einer Diskette ist gleich:
2847 Sektoren x 512 Bytes = 1457664 Bytes = 1423,5 KB
2) Die Informationslautstärke einer 1 Sekunde dauernden Tondatei ist gleich:
16 Bit x 48.000 x 2 = 1.536.000 Bit = 192.000 Byte = 187,5 KB/s
3) Die Spielzeit einer Stereo-Audiodatei mit einem Volumen von 1423,5 KB beträgt:
1423,5 KB: 187,5 KB/s = 7,6 s

Antwort: a) 3 Minuten; b) 7,6 Sekunden.

3. Binäre Audiokodierung.

Bei der Lösung von Problemen verwendet er folgendes theoretisches Material:

Um Audio zu kodieren, wird das in der Abbildung gezeigte analoge Signal verwendet

Die Ebene ist in vertikale und horizontale Linien unterteilt. Bei der vertikalen Partitionierung handelt es sich um die Abtastung des analogen Signals (Signalmessfrequenz), bei der horizontalen Partitionierung Quantisierung nach Level. Diese. Je feiner das Raster, desto besser ist die Annäherung an analogen Klang durch Zahlen. Die Acht-Bit-Quantisierung wird verwendet, um gewöhnliche Sprache zu digitalisieren ( Telefongespräch) und Radiosendungen auf Kurzwellen. Sechzehn-Bit – zum Digitalisieren von Musik und UKW-Radiosendungen (Ultrakurzwelle).

Stufe 3"

15. Das analoge Audiosignal wurde zunächst mit 256 Signalintensitäten (Rundfunk-Klangqualität) und dann mit 65.536 Signalintensitäten (Audio-CD-Klangqualität) abgetastet. Wie oft unterscheiden sich die Informationsmengen des digitalisierten Tons? (, S. 77, Nr. 2.86)

Lösung:

Die Codelänge eines analogen Signals beträgt bei Verwendung von 256 Signalintensitätsstufen 8 Bit und bei Verwendung von 65536 Signalintensitätsstufen 16 Bit. Da sich die Codelänge eines Signals verdoppelt hat, unterscheiden sich die Informationsmengen des digitalisierten Tons um den Faktor 2.

Antwort: 2 Mal.

Ebene "4"

16. Nach dem Nyquist-Kotelnikov-Theorem, damit ein analoges Signal aus seinen Signalen genau rekonstruiert werden kann diskrete Darstellung(entsprechend seinen Samples) muss die Sampling-Frequenz mindestens das Doppelte der maximalen Audiofrequenz dieses Signals betragen.

  • Wie hoch sollte die Abtastrate des für den Menschen wahrnehmbaren Tons sein?
  • Was sollte höher sein: die Abtastrate von Sprache oder die Abtastrate eines Symphonieorchesters?

Ziel: Den Studierenden die Eigenschaften von Hardware und Software für die Arbeit mit Ton näherbringen. Arten von Aktivitäten: Wissen aus einem Physikkurs aneignen (oder mit Nachschlagewerken arbeiten). (, S. ??, Aufgabe 2)

Lösung:

Es wird angenommen, dass der Frequenzbereich, den der Mensch hört, zwischen 20 Hz und 20 kHz liegt. Damit ein analoges Signal aus seiner diskreten Darstellung (aus seinen Abtastwerten) genau rekonstruiert werden kann, gilt nach dem Nyquist-Kotelnikov-Theorem Folgendes: Die Abtastrate muss mindestens das Doppelte der maximalen Audiofrequenz dieses Signals betragen. Die maximale Schallfrequenz, die eine Person hören kann, beträgt 20 kHz, was bedeutet, dass das Gerät ra und Software muss eine Abtastrate von mindestens 40 kHz, genauer gesagt 44,1 kHz, bieten. Computerverarbeitung Der Klang eines Sinfonieorchesters erfordert eine höhere Abtastrate als die Sprachverarbeitung, da der Frequenzbereich bei einem Sinfonieorchester viel größer ist.

Antwort: Nicht weniger als 40 kHz, die Abtastfrequenz eines Symphonieorchesters ist höher.

Level 5"

17. Die Abbildung zeigt den Klang einer Sekunde Sprache, die von einem Rekorder aufgezeichnet wurde. Kodieren Sie es in einen binären digitalen Code mit einer Frequenz von 10 Hz und einer Codelänge von 3 Bit. (, S. ??, Aufgabe 1)

Lösung:

Die Kodierung mit 10 Hz bedeutet, dass wir die Tonhöhe 10 Mal pro Sekunde messen müssen. Wählen wir äquidistante Zeitpunkte:

Eine Codelänge von 3 Bit bedeutet 2 3 = 8 Quantisierungsstufen. Das heißt, als numerischer Code für die Tonhöhe zu jedem ausgewählten Zeitpunkt können wir eine der folgenden Kombinationen festlegen: 000, 001, 010, 011, 100, 101, 110, 111. Es gibt nur 8 davon Bei ihnen kann daher die Tonhöhe in 8 „Stufen“ gemessen werden:

Wir werden die Tonhöhenwerte auf die nächstniedrigere Ebene „runden“:

Benutzen diese Methode Durch die Codierung erhalten wir das folgende Ergebnis (zur besseren Lesbarkeit sind Leerzeichen enthalten): 100 100 000 011 111 010 011 100 010 110.

Notiz. Es empfiehlt sich, die Studierenden darauf aufmerksam zu machen, wie ungenau der Code die Amplitudenänderung wiedergibt. Das heißt, die Abtastrate von 10 Hz und der Quantisierungsgrad von 2 3 (3 Bit) sind zu klein. Typischerweise wird für Ton (Sprache) eine Abtastfrequenz von 8 kHz, also 8000 Mal pro Sekunde, und eine Quantisierungsstufe von 2 8 (Code 8 Bit lang) gewählt.

Antwort: 100 100 000 011 111 010 011 100 010 110.

18. Erklären Sie, warum der Quantisierungsgrad neben der Abtastfrequenz die Hauptmerkmale der Klangdarstellung in einem Computer ist. Ziele: das Verständnis der Schüler für die Konzepte „Genauigkeit der Datendarstellung“, „Messfehler“ und „Darstellungsfehler“ zu festigen; Überprüfen Sie mit den Schülern die binäre Kodierung und die Codelänge. Art der Aktivität: Arbeiten mit Definitionen von Konzepten. (, S. ??, Aufgabe 3)

Lösung:

In der Geometrie, Physik und Technik gibt es den Begriff „Messgenauigkeit“, der eng mit dem Begriff „Messfehler“ zusammenhängt. Aber es gibt auch ein Konzept „Präzision der Darstellung“.Über die Größe einer Person können wir beispielsweise Folgendes sagen: a) ungefähr. 2 m, b) etwas mehr als 1,7 m, c) gleich 1 m 72 cm, d) gleich 1 m 71 cm 8 mm. Das heißt, 1, 2, 3 oder 4 Ziffern können zur Angabe der gemessenen Höhe verwendet werden.
Das Gleiche gilt für die binäre Kodierung. Wenn nur 2 Bit verwendet werden, um die Tonhöhe eines Tons zu einem bestimmten Zeitpunkt aufzuzeichnen, können selbst bei genauen Messungen nur 4 Stufen übertragen werden: niedrig (00), unterdurchschnittlich (01), überdurchschnittlich ( 10), hoch (11). Wenn Sie 1 Byte verwenden, können Sie 256 Ebenen übertragen. Wie höhere Quantisierungsstufe, oder, was dasselbe ist wie Je mehr Bits zur Erfassung des Messwertes vorgesehen sind, desto genauer wird dieser Wert übertragen.

Notiz. Zu beachten ist, dass das Messgerät auch die gewählte Quantisierungsstufe unterstützen muss (es macht keinen Sinn, die gemessene Länge mit einem Lineal mit Dezimeterteilung millimetergenau darzustellen).

Kodierung von Audioinformationen.

Arten von Aufgaben:

1. Größe der digitalen Audiodatei (Mono und Stereo).

Bei der Lösung von Problemen stützen sich die Studierenden auf folgende Konzepte:

Zeiterfassung – ein Verfahren, bei dem beim Kodieren eines kontinuierlichen Audiosignals die Schallwelle in einzelne kleine Zeitabschnitte unterteilt wird und für jeden dieser Abschnitte ein bestimmter Amplitudenwert eingestellt wird. Je größer die Amplitude des Signals, desto lauter der Ton.

Audiotiefe (Kodierungstiefe) –Anzahl der Bits pro Audiokodierung.

Lautstärkepegel (Signalpegel)- Der Ton kann unterschiedliche Lautstärken haben. Die Anzahl der verschiedenen Lautstärkestufen wird anhand der Formel berechnet N= 2 ICH WoICH– Klangtiefe.

Abtastfrequenz - Anzahl der Messungen des Eingangssignalpegels pro Zeiteinheit (pro 1 Sekunde). Je höher die Abtastrate, desto genauer ist das binäre Kodierungsverfahren. Die Frequenz wird in Hertz (Hz) gemessen. 1 Messung pro 1 Sekunde -1 Hz.

1000 Messungen in 1 Sekunde 1 kHz. Bezeichnen wir die Abtastrate mit dem BuchstabenD. Wählen Sie zur Kodierung eine von drei Frequenzen:44,1 kHz, 22,05 kHz, 11,025 kHz.

Es wird angenommen, dass der Frequenzbereich, den eine Person hört, aus dem Frequenzbereich stammt 20 Hz bis 20 kHz.

Qualität der Binärkodierung –ein Wert, der durch die Kodierungstiefe und die Abtastfrequenz bestimmt wird.

Audioadapter (Soundkarte) – ein Gerät, das elektrische Schwingungen der Tonfrequenz bei der Toneingabe in einen numerischen Binärcode und bei der Tonwiedergabe umgekehrt (von einem numerischen Code in elektrische Schwingungen) umwandelt.

Spezifikationen des Audioadapters:Abtastfrequenz und Registerbittiefe.

Registergröße - Anzahl der Bits im Audioadapterregister. Je größer die Ziffernkapazität, desto kleiner ist der Fehler jeder einzelnen Umrechnung der Größe des elektrischen Stroms in eine Zahl und umgekehrt. Wenn die Bittiefe ist ICH, dann kann bei der Messung das Eingangssignal 2 erhalten werdenICH = N unterschiedliche Bedeutungen.

Größe der digitalen Mono-Audiodatei (A) wird nach der Formel gemessen:

A= D* T* ICH/8 , WoDAbtastfrequenz (Hz),T– Zeitpunkt der Tonwiedergabe oder -aufnahme,ICHRegisterbreite (Auflösung). Nach dieser Formel wird die Größe in Bytes gemessen.

Größe der digitalen Stereo-Audiodatei (A) wird nach der Formel gemessen:

A=2* D* T* ICH/8 , das Signal wird für zwei Lautsprecher aufgezeichnet, da der linke und der rechte Tonkanal getrennt codiert werden.

Für Schüler ist es hilfreich, Tabelle 1 anzugeben, die zeigt, wie viele MB eine codierte Audioinformation von einer Minute bei unterschiedlichen Abtastraten belegen wird:

Signaltyp

Abtastfrequenz, kHz

16 Bit, Stereo

16 Bit, Mono

8 Bit, Mono

1. Größe der digitalen Datei

Stufe 3"

1. Bestimmen Sie die Größe (in Bytes) einer digitalen Audiodatei, deren Spielzeit 10 Sekunden bei einer Abtastrate von 22,05 kHz und einer Auflösung von 8 Bit beträgt. Die Datei ist nicht komprimiert. (, Seite 156, Beispiel 1)

Lösung:

Formel zur Berechnung der Größe (in Bytes) digitale Audiodatei: A= D* T* ICH/8.

Zur Konvertierung in Bytes muss der resultierende Wert durch 8 Bits geteilt werden.

22,05 kHz =22,05 * 1000 Hz =22050 Hz

A= D* T* ICH/8 = 22050 x 10 x 8 / 8 = 220500 Bytes.

Antwort: Die Dateigröße beträgt 220500 Bytes.

2. Bestimmen Sie die Speicherkapazität zum Speichern einer digitalen Audiodatei, deren Spielzeit zwei Minuten bei einer Abtastfrequenz von 44,1 kHz und einer Auflösung von 16 Bit beträgt. (, S. 157, Nr. 88)

Lösung:

A= D* T* ICH/8. – die Speicherkapazität zum Speichern einer digitalen Audiodatei.

44100 (Hz) x 120 (s) x 16 (Bits) / 8 (Bits) = Byte = 10335,9375 KB = 10,094 MB.

Antwort: ≈ 10 MB

Level 4"

3. Dem Benutzer steht eine Speicherkapazität von 2,6 MB zur Verfügung. Es ist erforderlich, eine digitale Audiodatei mit einer Tondauer von 1 Minute aufzunehmen. Wie hoch sollten die Abtastfrequenz und die Bittiefe sein? (, S. 157, Nr. 89)

Lösung:

Formel zur Berechnung der Abtastfrequenz und Bittiefe: D* I =A/T

(Speicherkapazität in Bytes) : (Erklingzeit in Sekunden):

2,6 MB = 26 Byte

D* I =A/T= 26 Bytes: 60 = 45438,3 Bytes

D=45438,3 Bytes: I

Die Adapterbreite kann 8 oder 16 Bit betragen. (1 Byte oder 2 Byte). Daher kann die Abtastfrequenz entweder 45438,3 Hz = 45,4 kHz ≈ betragen 44,1 kHz–standardmäßige charakteristische Abtastfrequenz oder 22719,15 Hz = 22,7 kHz ≈ 22,05 kHz- Standard-charakteristische Abtastrate

Antwort:

Abtastfrequenz

Kapazität des Audioadapters

1 Option

22,05 kHz

16 Bit

Option 2

44,1 kHz

8 Bit

4. Der freie Speicher auf der Festplatte beträgt 5,25 MB, die Bittiefe der Soundkarte beträgt 16. Wie lange dauert der Ton einer digitalen Audiodatei, die mit einer Abtastfrequenz von 22,05 kHz aufgenommen wurde? (, S. 157, Nr. 90)

Lösung:

Formel zur Berechnung der Schalldauer: T=A/D/I

(Speicherkapazität in Bytes): (Abtastfrequenz in Hz): (Soundkartenkapazität in Bytes):

5,25 MB = 5505024 Bytes

5505024 Bytes: 22050 Hz: 2 Bytes = 124,8 Sek
Antwort: 124,8 Sekunden

5. Eine Minute Aufnahme einer digitalen Audiodatei beansprucht 1,3 MB Speicherplatz, die Bittiefe der Soundkarte beträgt 8. Mit welcher Abtastrate wird der Ton aufgenommen? (, S. 157, Nr. 91)

Lösung:

Formel zur Berechnung der Abtastrate: D = A/T/I

(Speicherkapazität in Bytes) : (Aufnahmezeit in Sekunden) : (Soundkartenkapazität in Bytes)

1,3 MB = 18 Byte

18 Byte: 60:1 = 22719,1 Hz

Antwort: 22,05 kHz

6. Zwei Minuten Aufnahme einer digitalen Audiodatei beanspruchen 5,1 MB Speicherplatz. Abtastfrequenz - 22050 Hz. Welche Bittiefe hat der Audioadapter? (, S. 157, Nr. 94)

Lösung:

Formel zur Berechnung der Bittiefe: (Speicherkapazität in Bytes): (Erkundungszeit in Sekunden): (Abtastfrequenz):

5,1 MB = 56 Byte

56 Bytes: 120 Sek.: 22050 Hz = 2,02 Bytes = 16 Bits

Antwort: 16 Bit

7. Der freie Speicher auf der Festplatte beträgt 0,01 GB, die Bittiefe der Soundkarte beträgt 16. Wie lange dauert der Ton einer digitalen Audiodatei, die mit einer Abtastfrequenz von 44100 Hz aufgenommen wurde? (, S. 157, Nr. 95)

Lösung:

Formel zur Berechnung der Schalldauer T=A/D/I

(Speicherkapazität in Bytes) : (Abtastfrequenz in Hz) : (Soundkartenkapazität in Bytes)

0,01 GB = 0,24 Byte

24 Bytes: 44100: 2 = 121,74 Sek. = 2,03 Min
Antwort: 20,3 Minuten

8. Schätzen Sie den Informationsumfang einer Mono-Audiodatei mit einer Tondauer von 1 Minute. wenn die Kodierungstiefe und die Abtastfrequenz des Audiosignals gleich sind:
a) 16 Bit und 8 kHz;
b) 16 Bit und 24 kHz.

(, S. 76, Nr. 2.82)

Lösung:

A).
16 Bit x 8.000 = 128.000 Bit = 16.000 Byte = 15,625 KB/s
15,625 KB/s x 60 s = 937,5 KB

B).
1) Die Informationslautstärke einer 1 Sekunde dauernden Tondatei ist gleich:
16 Bit x = 384000 Bit = 48000 Byte = 46,875 KB/s
2) Die Informationslautstärke einer 1-minütigen Audiodatei beträgt:
46,875 KB/s x 60 s = 2812,5 KB = 2,8 MB

Antwort: a) 937,5 KB; b) 2,8 MB

Level 5"

Tabelle 1 wird verwendet

9. Wie viel Speicher wird benötigt, um eine digitale Audiodatei mit hochwertiger Tonaufnahme zu speichern, vorausgesetzt, die Spieldauer beträgt 3 Minuten? (, S. 157, Nr. 92)

Lösung:

Eine hohe Klangqualität wird bei einer Abtastfrequenz von 44,1 kHz und einer Audioadapter-Bittiefe von 16 erreicht.
Formel zur Berechnung der Speicherkapazität: (Aufnahmezeit in Sekunden) x (Soundkartenkapazität in Bytes) x (Abtastfrequenz):
180 s x 2 x 44100 Hz = Byte = 15,1 MB
Antwort: 15,1 MB

10. Die digitale Audiodatei enthält eine Audioaufnahme von schlechter Qualität (der Ton ist dunkel und gedämpft). Wie lange dauert eine Datei, wenn sie 650 KB groß ist? (, S. 157, Nr. 93)

Lösung:

Die folgenden Parameter sind typisch für düsteren und gedämpften Klang: Abtastfrequenz – 11,025 KHz, Bittiefe des Audioadapters – 8 Bit (siehe Tabelle 1). Dann ist T=A/D/I. Lassen Sie uns das Volumen in Bytes umrechnen: 650 KB = 665600 Bytes

Т=665600 Bytes/11025 Hz/1 Byte ≈60,4 s

Antwort: Die Dauer des Tons beträgt 60,5 s

Lösung:

Die Informationslautstärke einer 1 Sekunde dauernden Tondatei beträgt:
16 Bit xx 2 = 1 Bit = 187,5 KB (multipliziert mit 2, da es sich um Stereo handelt).

Die Informationsmenge einer Audiodatei von 1 Minute Dauer beträgt:
187,5 KB/s x 60 s ≈ 11 MB

Antwort: 11 MB

Antwort: a) 940 KB; b) 2,8 MB.

12. Berechnen Sie die Spielzeit einer Mono-Audiodatei, wenn ihre Lautstärke bei 16-Bit-Kodierung und einer Abtastfrequenz von 32 kHz gleich ist:
a) 700 KB;
b) 6300 KB

(, S. 76, Nr. 2.84)

Lösung:

A).
1) Die Informationslautstärke einer 1 Sekunde dauernden Tondatei ist gleich:

700 KB: 62,5 KB/s = 11,2 s

B).
1) Die Informationslautstärke einer 1 Sekunde dauernden Tondatei ist gleich:
16 Bit x = 512000 Bit = 64000 Byte = 62,5 KB/s
2) Die Abspielzeit einer 700 KB großen Mono-Audiodatei beträgt:
6300 KB: 62,5 KB/s = 100,8 s = 1,68 min

Antwort: a) 10 Sekunden; b) 1,5 Min.

13. Berechnen Sie, wie viele Informationsbytes eine Sekunde Stereoaufnahme auf einer CD einnimmt (Frequenz 44032 Hz, 16 Bit pro Wert). Wie lange dauert eine Minute? Wie hoch ist die maximale Festplattenkapazität (bei einer maximalen Dauer von 80 Minuten)? (, S. 34, Übung Nr. 34)

Lösung:

Formel zur Berechnung der Speichergröße A= D* T* ICH:
(Aufnahmezeit in Sekunden) * (Soundkartenkapazität in Bytes) * (Abtastfrequenz). 16 Bits – 2 Bytes.
1) 1s x 2 x 44032 Hz = 88064 Bytes (1 Sekunde Stereo-CD-Aufnahme)
2) 60s x 2 x 44032 Hz = 5283840 Bytes (1 Minute Stereo-CD-Aufnahme)
3) 4800s x 2 x 44032 Hz = Byte = 412800 KB = 403,125 MB (80 Minuten)

Antwort: 88064 Bytes (1 Sekunde), 5283840 Bytes (1 Minute), 403,125 MB (80 Minuten)

2. Bestimmung der Klangqualität.

Um die Klangqualität zu bestimmen, müssen Sie die Abtastfrequenz ermitteln und Tabelle Nr. 1 verwenden

Signalintensitätsstufen – Klangqualität von Radiosendungen, mit 65 Signalintensitätsstufen – Audio-CD-Klangqualität. Die Frequenz mit der höchsten Qualität entspricht der auf einer CD aufgenommenen Musik. Die Größe des analogen Signals wird in diesem Fall 44.100 Mal pro Sekunde gemessen.

Level 5"

13. Bestimmen Sie die Tonqualität (Rundfunkqualität, Durchschnittsqualität, Audio-CD-Qualität), wenn bekannt ist, dass die Lautstärke einer Mono-Audiodatei mit einer Tondauer von 10 Sekunden beträgt. gleich:
a) 940 KB;
b) 157 KB.

(, S. 76, Nr. 2.83)

Lösung:

A).
1) 940 KB = 962560 Byte = 7700480 Bit
2) 7700480 Bits: 10 Sek. = 770048 Bits/s
3) 770048 bps: 16 Bit = 48128 Hz – Abtastrate – nahe der höchsten 44,1 kHz
Antwort: Audio-CD-Qualität

B).
1) 157 KB = 160768 Byte = 1286144 Bit
2) 1286144 Bits: 10 Sek. = 4 Bit/s
3) 4 bps: 16 Bit = 8038,4 Hz
Antwort: Sendequalität

Antwort: a) CD-Qualität; b) Qualität der Radiosendung.

14. Bestimmen Sie die Länge der Audiodatei, die auf eine 3,5-Zoll-Diskette passt. Bitte beachten Sie, dass auf einer solchen Diskette 2847 Sektoren mit 512 Bytes zum Speichern von Daten reserviert sind.
a) mit geringer Tonqualität: Mono, 8 Bit, 8 kHz;
b) mit hoher Klangqualität: Stereo, 16 Bit, 48 kHz.

(, S. 77, Nr. 2.85)

Lösung:

A).

8 Bit x 8.000 = Bit = 8000 Byte = 7,8 KB/s
3) Die Spielzeit einer Mono-Audiodatei mit einem Volumen von 1423,5 KB beträgt:
1423,5 KB: 7,8 KB/s = 182,5 s ≈ 3 Min

B).
1) Das Informationsvolumen einer Diskette ist gleich:
2847 Sektoren x 512 Bytes = 1457664 Bytes = 1423,5 KB
2) Die Informationslautstärke einer 1 Sekunde dauernden Tondatei ist gleich:
16 Bit xx 2= 1 Bit = Byte = 187,5 KB/s
3) Die Spielzeit einer Stereo-Audiodatei mit einem Volumen von 1423,5 KB beträgt:
1423,5 KB: 187,5 KB/s = 7,6 s

Antwort: a) 3 Minuten; b) 7,6 Sekunden.

3. Binäre Audiokodierung.

Bei der Lösung von Problemen verwendet er folgendes theoretisches Material:

Um Audio zu kodieren, wird das in der Abbildung gezeigte analoge Signal verwendet

Die Ebene ist in vertikale und horizontale Linien unterteilt. Bei der vertikalen Partitionierung handelt es sich um die Abtastung des analogen Signals (Signalmessfrequenz), bei der horizontalen Partitionierung Quantisierung nach Level. Das heißt, je feiner das Raster, desto besser ist die Annäherung an analogen Klang anhand von Zahlen. Die Acht-Bit-Quantisierung wird zur Digitalisierung gewöhnlicher Sprache (Telefongespräche) und Kurzwellenradioübertragungen verwendet. Sechzehn-Bit – zur Digitalisierung von Musik und UKW-Radiosendungen (Ultrakurzwelle).

Stufe 3"

15. Das analoge Audiosignal wurde zunächst mit 256 Signalintensitäten (Rundfunk-Klangqualität) und dann mit 65.536 Signalintensitäten (Audio-CD-Klangqualität) abgetastet. Wie oft unterscheiden sich die Informationsmengen des digitalisierten Tons? (, S. 77, Nr. 2.86)

Lösung:

Die Codelänge eines analogen Signals beträgt bei Verwendung von 256 Signalintensitätsstufen 8 Bit und bei Verwendung von 65536 Signalintensitätsstufen 16 Bit. Da sich die Codelänge eines Signals verdoppelt hat, unterscheiden sich die Informationsmengen des digitalisierten Tons um den Faktor 2.

Antwort: 2 Mal.

Ebene "4"

16. Nach dem Nyquist-Kotelnikov-Theorem muss die Abtastfrequenz mindestens doppelt so hoch sein wie die maximale Audiofrequenz dieses Signals, damit ein analoges Signal aus seiner diskreten Darstellung (aus seinen Abtastwerten) genau rekonstruiert werden kann.

· Wie hoch sollte die Abtastrate des für den Menschen wahrnehmbaren Tons sein?

· Was sollte höher sein: die Abtastrate von Sprache oder die Abtastrate eines Symphonieorchesters?

Ziel: Den Studierenden die Eigenschaften von Hardware und Software für die Arbeit mit Ton näherbringen. Arten von Aktivitäten: Wissen aus einem Physikkurs aneignen (oder mit Nachschlagewerken arbeiten). (, S. ??, Aufgabe 2)

Lösung:

Es wird angenommen, dass der Frequenzbereich, den der Mensch hört, zwischen 20 Hz und 20 kHz liegt. Damit ein analoges Signal aus seiner diskreten Darstellung (aus seinen Abtastwerten) genau rekonstruiert werden kann, gilt nach dem Nyquist-Kotelnikov-Theorem Folgendes: Die Abtastrate muss mindestens das Doppelte der maximalen Audiofrequenz dieses Signals betragen. Die maximale Schallfrequenz, die eine Person hören kann, beträgt 20 kHz, was bedeutet, dass das Gerät Ra und Software müssen eine Abtastfrequenz von mindestens 40 kHz, genauer gesagt 44,1 kHz, bereitstellen. Die Computerverarbeitung des Klangs eines Sinfonieorchesters erfordert eine höhere Abtastrate als die Sprachverarbeitung, da der Frequenzbereich bei einem Sinfonieorchester viel größer ist.

Antwort: Nicht weniger als 40 kHz, die Abtastfrequenz eines Symphonieorchesters ist höher.

Level 5"

17. Die Abbildung zeigt den Klang einer Sekunde Sprache, die von einem Rekorder aufgezeichnet wurde. Kodieren Sie es in einen binären digitalen Code mit einer Frequenz von 10 Hz und einer Codelänge von 3 Bit. (, S. ??, Aufgabe 1)

Lösung:

Die Kodierung mit 10 Hz bedeutet, dass wir die Tonhöhe 10 Mal pro Sekunde messen müssen. Wählen wir äquidistante Zeitpunkte:

Eine Codelänge von 3 Bit bedeutet 23 = 8 Quantisierungsstufen. Das heißt, als numerischer Code für die Tonhöhe zu jedem ausgewählten Zeitpunkt können wir eine der folgenden Kombinationen festlegen: 000, 001, 010, 011, 100, 101, 110, 111. Es gibt nur 8 davon Bei ihnen kann daher die Tonhöhe in 8 „Stufen“ gemessen werden:

Wir werden die Tonhöhenwerte auf die nächstniedrigere Ebene „runden“:

Mit dieser Codierungsmethode erhalten wir das folgende Ergebnis (zur besseren Lesbarkeit sind Leerzeichen enthalten):

Notiz. Es empfiehlt sich, die Studierenden darauf aufmerksam zu machen, wie ungenau der Code die Amplitudenänderung wiedergibt. Das heißt, die Abtastfrequenz von 10 Hz und der Bitquantisierungsgrad sind zu klein. Typischerweise wird für Ton (Sprache) eine Abtastfrequenz von 8 kHz, also 8000 Mal pro Sekunde, und eine Quantisierungsstufe von 28 (8-Bit-Code) gewählt.

Antwort:

18. Erklären Sie, warum der Quantisierungsgrad neben der Abtastfrequenz die Hauptmerkmale der Klangdarstellung in einem Computer ist. Ziele: das Verständnis der Schüler für die Konzepte „Genauigkeit der Datendarstellung“, „Messfehler“ und „Darstellungsfehler“ zu festigen; Überprüfen Sie mit den Schülern die binäre Kodierung und die Codelänge. Art der Aktivität: Arbeiten mit Definitionen von Konzepten. (, S. ??, Aufgabe 3)

Lösung:

In der Geometrie, Physik und Technik gibt es den Begriff „Messgenauigkeit“, der eng mit dem Begriff „Messfehler“ zusammenhängt. Aber es gibt auch ein Konzept „Präzision der Darstellung“.Über die Größe einer Person können wir beispielsweise Folgendes sagen: a) ungefähr. 2 m, b) etwas mehr als 1,7 m, c) gleich 1 m 72 cm, d) gleich 1 m 71 cm 8 mm. Das heißt, 1, 2, 3 oder 4 Ziffern können zur Angabe der gemessenen Höhe verwendet werden.
Das Gleiche gilt für die binäre Kodierung. Wenn nur 2 Bit verwendet werden, um die Tonhöhe eines Tons zu einem bestimmten Zeitpunkt aufzuzeichnen, können selbst bei genauen Messungen nur 4 Stufen übertragen werden: niedrig (00), unterdurchschnittlich (01), überdurchschnittlich ( 10), hoch (11). Wenn Sie 1 Byte verwenden, können Sie 256 Ebenen übertragen. Wie höhere Quantisierungsstufe, oder, was dasselbe ist wie Je mehr Bits zur Erfassung des Messwertes vorgesehen sind, desto genauer wird dieser Wert übertragen.

Notiz. Zu beachten ist, dass das Messgerät auch die gewählte Quantisierungsstufe unterstützen muss (es macht keinen Sinn, die gemessene Länge mit einem Lineal mit Dezimeterteilung millimetergenau darzustellen).

Antwort: Je höher die Quantisierungsstufe, desto genauer wird der Ton übertragen.

Literatur:

[ 1] Informatik. Problembuch-Workshop in 2 Bänden /Hrsg. , : Band 1. – Labor Grundwissen, 1999 – 304 S.: Abb.

Workshop zu Informatik und Informationstechnologie. Lernprogramm für Bildungseinrichtungen / , . – M.: Binom. Laboratory of Knowledge, 20 S.: Abb.

Informatik in der Schule: Beilage zur Zeitschrift „Informatik und Bildung“. Nr. 4 - 2003. - M.: Bildung und Informatik, 2003. - 96 S.: Abb.

Usw. Informationskultur: Informationskodierung. Informationsmodelle. Klassen 9-10: Lehrbuch für allgemeinbildende Einrichtungen. - 2. Aufl. - M.: Bustard, 1996. - 208 S.: Abb.

Senokosov über Informatik für Schulkinder. - Jekaterinburg: „U-Factoria“, 2003. - 346. S. 54-56.

Das menschliche Ohr nimmt Schall mit Frequenzen zwischen 20 Schwingungen pro Sekunde (leiser Schall) und 20.000 Schwingungen pro Sekunde (hoher Schall) wahr.

Ein Mensch kann Schall in einem riesigen Intensitätsbereich wahrnehmen, wobei die maximale Intensität 10-14-mal größer ist als die minimale (einhunderttausend Milliarden Mal). Zur Messung der Lautstärke wird ein spezielles Gerät verwendet "Dezibel"(dbl) (Tabelle 5.1). Eine Verringerung oder Erhöhung der Lautstärke um 10 dbl entspricht einer Verringerung oder Erhöhung der Schallintensität um das Zehnfache.

Zeitliche Tonabtastung. Damit ein Computer Ton verarbeiten kann, muss das kontinuierliche Audiosignal mithilfe von Zeitabtastung in eine digitale diskrete Form umgewandelt werden. Eine kontinuierliche Schallwelle wird in einzelne kleine temporäre Abschnitte unterteilt und für jeden dieser Abschnitte wird ein bestimmter Wert der Schallintensität eingestellt.

Somit wird die kontinuierliche Abhängigkeit der Lautstärke von der Zeit A(t) durch eine diskrete Folge von Lautstärkepegeln ersetzt. In der Grafik sieht dies so aus, als würde man eine glatte Kurve durch eine Folge von „Schritten“ ersetzen (Abb. 1.2).


Reis. 1.2. Zeitliche Abtastung von Audio

Abtastfrequenz.Über ein an die Soundkarte angeschlossenes Mikrofon wird analoges Audio aufgenommen und in digitale Form umgewandelt. Qualität des Erhaltenen digitaler Ton hängt von der Anzahl der Messungen des Schallvolumenpegels pro Zeiteinheit ab, d.h. Abtastraten. Je mehr Messungen pro Sekunde durchgeführt werden (je höher die Abtastfrequenz), desto genauer folgt die „Leiter“ des digitalen Audiosignals der Kurve des Dialogsignals.

Audio-Abtastrate ist die Anzahl der Lautstärkemessungen pro Sekunde.

Die Audio-Abtastraten können zwischen 8.000 und 48.000 Lautstärkemessungen pro Sekunde liegen.

Tiefe der Audiokodierung. Jedem „Schritt“ ist eine bestimmte Lautstärke zugeordnet. Schalllautstärken können als eine Menge möglicher Zustände N betrachtet werden, deren Kodierung eine bestimmte Informationsmenge I erfordert, die als Schallkodierungstiefe bezeichnet wird.

Tiefe der Audiokodierung ist die Menge an Informationen, die zum Kodieren diskreter Lautstärkepegel von digitalem Audio erforderlich ist.

Wenn die Kodierungstiefe bekannt ist, kann die Anzahl der digitalen Lautstärkepegel mithilfe der Formel N = 2 I berechnet werden. Angenommen, die Audiokodierungstiefe beträgt 16 Bit, dann ist die Anzahl der Audiolautstärkepegel gleich:

N = 2 I = 2 · 16 = 65.536.

Während des Codierungsprozesses wird jeder Lautstärkestufe ein eigener 16-Bit-Binärcode zugewiesen. Die niedrigste Lautstärke entspricht dem Code 0000000000000000 und die höchste 1111111111111111.

Digitalisierte Klangqualität. Je höher die Frequenz und die Abtasttiefe des Tons, desto höher ist die Qualität des digitalisierten Tons. Digitalisiertes Audio mit der niedrigsten Qualität entsprechend der Qualität Telefonkommunikation, erhalten mit einer Abtastrate von 8000 Mal pro Sekunde, einer Abtasttiefe von 8 Bit und der Aufnahme einer Audiospur (Monomodus). Die höchste Qualität digitalisierter Audiodaten, die der Audio-CD-Qualität entspricht, wird mit einer Abtastrate von 48.000 Mal pro Sekunde, einer Abtasttiefe von 16 Bit und der Aufnahme von zwei Audiospuren (Stereomodus) erreicht.

Es muss beachtet werden, dass je höher die Qualität des digitalen Tons ist, desto größer ist das Informationsvolumen der Tondatei. Sie können den Informationsumfang einer digitalen Stereo-Audiodatei mit einer Tondauer von 1 Sekunde bei durchschnittlicher Tonqualität (16 Bit, 24.000 Messungen pro Sekunde) abschätzen. Dazu muss die Kodierungstiefe mit der Anzahl der Messungen in 1 Sekunde multipliziert und mit 2 multipliziert werden (Stereoton):

16 Bit × 24.000 × 2 = 768.000 Bit = 96.000 Byte = 93,75 KB.

Tonredakteure. Mit Sound-Editoren können Sie Sound nicht nur aufnehmen und wiedergeben, sondern auch bearbeiten. Digitalisierter Ton wird in Toneditoren in visueller Form dargestellt, sodass das Kopieren, Verschieben und Löschen von Teilen der Audiospur einfach mit der Maus ausgeführt werden kann. Darüber hinaus können Sie Audiospuren übereinander legen (Sounds mischen) und verschiedene akustische Effekte anwenden (Echo, Rückwärtswiedergabe usw.).

Mit Sound-Editoren können Sie die Qualität des digitalen Audios und die Größe der Audiodatei ändern, indem Sie die Abtastrate und die Kodierungstiefe ändern. Digitalisiertes Audio kann unkomprimiert in Audiodateien in einem universellen Format gespeichert werden WAV oder im komprimierten Format MP3.

Beim Speichern von Ton in komprimierten Formaten werden Tonfrequenzen geringer Intensität verworfen, die für die menschliche Wahrnehmung „übermäßig“ sind und zeitlich mit Tonfrequenzen hoher Intensität übereinstimmen. Die Verwendung dieses Formats ermöglicht die Dutzende Komprimierung von Audiodateien, führt jedoch zu einem irreversiblen Informationsverlust (Dateien können nicht in ihrer ursprünglichen Form wiederhergestellt werden).

Kontrollfragen

1. Wie wirken sich Abtastrate und Kodierungstiefe auf die Qualität digitaler Audiodaten aus?

Aufgaben zur selbstständigen Bearbeitung

1.22. Selektive Reaktionsaufgabe. Die Soundkarte erzeugt eine binäre Kodierung des analogen Audiosignals. Wie viele Informationen werden benötigt, um jede der 65.536 möglichen Signalintensitätsstufen zu kodieren?
1) 16 Bit; 2) 256 Bit; 3) 1 Bit; 4) 8 Bit.

1.23. Eine Aufgabe mit ausführlicher Antwort. Schätzen Sie das Informationsvolumen digitaler Audiodateien mit einer Dauer von 10 Sekunden bei einer Codierungstiefe und Audiosignal-Abtastfrequenz, die minimale und maximale Klangqualität bieten:
a) Mono, 8 Bit, 8000 Messungen pro Sekunde;
b) Stereo, 16 Bit, 48.000 Messungen pro Sekunde.

1.24. Eine Aufgabe mit ausführlicher Antwort. Bestimmen Sie die Dauer der Sounddatei, die auf eine 3,5-Zoll-Diskette passt (beachten Sie, dass auf einer solchen Diskette 2847 Sektoren mit jeweils 512 Bytes zum Speichern von Daten reserviert sind):
a) mit geringer Tonqualität: Mono, 8 Bit, 8000 Messungen pro Sekunde;
b) mit hoher Klangqualität: Stereo, 16 Bit, 48.000 Messungen pro Sekunde.



Freunden erzählen