Monitorování při záznamu

…s podtitulem „možnosti a jejich výhody/nevýhody“. Tento článek jsem zaměřil na problematiku monitorování (nejen) audio signálu při záznamu. Čas od času narazím totiž na různé dotazy na toto téma, takže mi přijde, že uživatelé-začátečnící v tom nemusí mít úplně přehled; a zde bych jim tedy dal prakticky ucelený set informací. Jako pracovní prostředí poslouží opět Cubase, zde ve verzi 12.

Co to je monitorování

Monitorování, neboli „Monitoring“ (ano – je dobré znát i příslušnou anglickou terminologii) slouží k tomu, abychom si v reálném čase mohli poslechnout, co vlastně nahráváme. Od sledování a nastavení správných úrovní tu jsou měřáky, ale ty neodhalí nic z obsahové stránky věci. Čili například naindukovaný brum do kabelu, zkreslení signálu přílišným akustickým tlakem na mikrofon nebo jiné, obvykle negativní, záležitosti – na to je již potřeba lidské ucho a tím pádem i zmiňovaná monitorace. Pokud se budeme bavit o domácím studiu, potažmo tedy hlavně o hobby úrovni, tak následující řádky rozeberou tzv. „přímé“ a „nepřímé“ monitorování. Ve větších studiích, obzvlášť za situace, kdy je k dispozici nějaká varianta hardwarové mixážní konzole, budou ve většině případů využívat to přímé, ale není to samozřejmě pravidlo a umím si představit, že tomu tak nebude vždy. Ostatně oba způsoby mají svá pozitiva a negativa a jde jen o to, co je v daném případě možné použít, případně co je vhodnější nebo je více oblíbené. Takže jdeme na to.

Nepřímé monitorování

Neboli „softwarové“, „skrz DAW“ a zřejmě by se dala najít ještě další označení. Všechna ale říkají totéž: nahrávaný signál je monitorovaný až v rámci programu (DAW), do kterého se nahrává. Tato varianta je prakticky k dispozici vždy, tj. bez ohledu na to, zdali ta která zvuková karta umožňuje (ať už hardwarově nebo pomocí svého ovladače) i variantu přímého monitorování. V Cubase je funkce k dispozici u Audio, MIDI a Instrument (Nástrojových) stop a má podobu reproduktoru v oranžovém poli:

Výhodou tohoto způsobu je nesporně možnost efektování signálu, přičemž se ale nahrává pouze ten, co jde do vstupu (čili neefektovaný). Samozřejmě lze nahrávat i efektovaný signál; pak se ale příslušné moduly FX nevkládají do cílové audio stopy, ale do vstupního kanálu (Input Channel):

FX moduly vložené do cílové audio stopy nijak neovlivňují nahrávané audio!

Co je ale nevýhodou – latence. Protože v tomto případě prochází signál softwarovým zpracováním, nevyhnutelně je poslouchaný výstup zpožděn oproti vstupu, a to právě o hodnotu latence (nezapomenout na sečtení Input a Output hodnot). Takže pro (řekněme) běžnou práci a pro fajn stabilitu systému budete mít nastavený Audio Buffer zvukové karty na hodnotu 512 samplů, takže výsledná latence bude okolo 26ms:

Pro smysluplnou práci za použití SW monitorování se uvádí jako horní hranice latence cca 10ms (což by nemělo být vnímatelné zpoždění – alespoň nijak zásadně), takže nastavení Audio Bufferu by pak muselo být zhruba na 128 samplech:

Vypadá to vyloženě jednoduše. Nicméně je potřeba vědět, že snižováním hodnoty Audio Bufferu se zvyšují nároky na výpočetní výkon počítače, což lze vidět v Cubase v okně Audio Performance. Pro určité srovnání následují obrázky pro hodnoty 512, 128 a 16 samplů:

Zjevně minoritní rozdíly, ale jedná se o prázdný projekt – výpočetní požadavky rostou s počtem audio stop, FX a virtuálních nástrojů (VSTi), takže se tímto klidovým stavem nenechte zmást. Jakmile přestane počítač stíhat, projeví se to výpadky v audiu a jeho zkreslením; navíc se v okně Audio Performance rozsvítí i indikátor Overload:

Tyto indikátory jsou dva: jeden pro CPU (viz obrázek) a druhý pro disk. V dnešní době (SATA připojení, SSD či NVMe disky) asi nebude úplně jednoduché dobrat se rozsvícení Overload kontrolky i pro disk, ale při dostatečně náročném projektu co se audio stop týče, které budou nahrány v rozlišení například 32 bitů při 96/192 kHz samplovací frekvenci by se to určitě mohlo povést. Tyto parametry se ale obvykle domácích hobby studií netýkají, takže zřejmě není třeba se strachovat v oblasti kapacity datového přenosu z/na pevný disk. Vše lze ostatně alespoň v hrubých rysech vypočítat; stačí pouze znát způsob připojení disku (a i přenosovou kapacitu disku – liší se pro čtení/zápis!), kde jsou audio soubory příslušící projektu. Když si pro ilustraci vezmeme, že se bude pracovat v celkem standardním rozlišení 24 bitů při 44100 Hz samplovací frekvenci, tak pro MONO stopu se jedná o datový tok 24*44100=1058400 bitů/s, čili něco málo přes 1Mbit/s. Pro STEREO stopu to bude dvojnásobek. Podělením přenosové kapacity disku první či druhou hodnotou dostanete hrubou představu o možném počtu MONO či STEREO stop (případné kombinace pak budou prostě někde mezi nimi). Osobně si nemyslím, že by v tomto segmentu mohlo vzniknout slabé místo i v případě použití konvenčního (tj. rotačního) disku 7200 ot/s připojeném SATA rozhraním. Řekl bych, že se dříve „dojede“ na ten výpočetní výkon.
Z výše uvedeného vyplývá jednoduché pravidlo: přestane-li počítač v nějaké fázi projektu „stíhat“, což se projeví slyšitelně na zvuku (a měl by to potvrdit i popisovaný indikátor Audio Performance), dá se z toho poněkud utéci zvýšením hodnoty Audio Buffer, ale to také nejde do nekonečna; stropem je obvykle hodnota 2048 samplů:

Pokud jste již na tomto maximu a projekt představuje takovou zátěž pro počítač, že tento prostě nestíhá audio zpracovávat, přijdou ke slovu různé pomocné techniky, jakou je třeba vyexportování části mixu (například stopy bicích) do jedné stopy a povypínání všeho, co souvisí s těmi původními stopami. Práci to sice komplikuje, ale jiná varianta prakticky není. Na druhém konci možností je upgrade počítače – buď jeho části nebo jako celku, záleží na použité sestavě a na aktuálních možnostech (spíše než finančních to jsou ty technické). Ale toto již přesahuje mimo rámec a univerzální doporučení zde neexistuje.

Přímé monitorování (Direct)

Z výkonnostního pohledu je vynikajícím řešením tzv. „přímé“, neboli „Direct“ monitorování. Jedná se vlastně o funkcionalitu, kterou musí podporovat samotný HW (čili zvuková karta) a následně pak buď pomocí fyzického ovladače, dedikované aplikace nebo vlastního ovladače jí lze využít. Variant je tedy několik a pokusím se zachytit všechny (o kterých vím).

Fyzický ovladač

Mívá podobu tlačítka (Steinberg UR12) nebo otočného knobu (Steinberg UR22, Behringer UMC404HD). Na panelu karty se dá občas najít i přepínač mono/stereo pro tento signál (UMC404HD, Focusrite Scarlett 2i2). U varianty „tlačítko“ se jedná o prakticky to nejjednodušší provedení, kdy se prostě signál ze vstupu přimíchá k přehrávanému audiu z počítače. Poměr je fixní a je-li potřeba například slyšet vstup více než podklad, musí se hlasitost podkladu stáhnout v DAW.

U varianty „knob“ je to malinko sofistikovanější. Krajní polohy jsou obvykle označeny jako „IN“ (Input – vstup) a „PB“ (Playback – přehrávání). V poloze IN je do výstupu/výstupů posílán pouze signál ze vstupu/vstupů. Postupným otáčením směrem k PB poloze se přimíchává přehrávaný podklad (intenzita vstupního signálu se nemění); v polovině rozsahu je poměr 50:50 ve smyslu, že přehrávané audio má maximální intenzitu a vstupní signál též. Dalším otáčením směrem k poloze PB se postupně ztišuje vstupní signál (hlasitost přehrávaného se nemění) až dojde k tomu, že vstup (přímý) není slyšet vůbec a do výstupů vede jen přehrávaný podklad.
Zde se již dá vyladit vzájemný poměr hlasitosti vstupního signálu a přehrávaného podkladu, aniž by se muselo nějak pracovat na úrovni mixu v počítači.
U obou variant se lze na předním panelu zvukovky setkat ještě se zmíněným přepínačem mono/stereo, který zajistí, že při nahrávání MONO zdroje (například kytary přímo kabelem) nebude zvuk slyšet jen v jednom kanále, což by mohlo působit rušivě, případně při záznamu stereo signálu (klávesy apod.) umí monitorovací trasu „zmonit“ – zde ale pozor na změnu například barvy syntezátorového zvuku! Toto může být řešeno případně v aplikaci zvukové karty (tj. v jejím Ovládacím panelu, případně dedikované aplikaci Mixeru). Obvykle je to ale „výsada“ spíše zvukovek s přímým monitorováním zajištěným právě jejich DSP aplikací nebo ovladačem (a větší či menší integrací do DAW).

Pozor na případnou aktivaci tlačítka Monitor u nahrávaných stop – pokud by k přehrávanému signálu byl přimícháván i tento (zpožděný o latenci – viz výše), došlo by k efektu „hřebenového filtru“ a zřejmě byste se poněkud podivovali, jaký zvuk že se to z hraného nástroje line. Případně je ta prodleva natolik veliká, že prostě bude vadit a nedá se za takových podmínek vůbec s podkladem hrát ani do něj zpívat. Pravidlo prostě je, že má-li se těžit z výhod Přímého monitorování, nelze s ním paralelně kombinovat monitorování cestou DAW (až na výjimku popisovanou na konci článku, která se týká reverbu).

Ve všech případech je v nastavení audio systému v DAW zatržítko Direct Monitoring neaktivní.

SW varianta – ovladač

Zde bychom se mohli bavit o dvou způsobech, pokud si správně pamatuji. Oba mají společné to, že v nastavení audio systému DAW je aktivní zatržítko Direct Monitoring, které změní funkcionalitu tlačítka Monitor u stopy tak, že jeho stisknutím se monitoruje signál ze vstupu. Co se nastavení poměrů vstupního/přehrávaného zvuku, tak je potřeba toto pořešit v mixu DAW (podobně jako v případě HW tlačítka zmíněného výše). Moc hluboko jsem nepátral, ale myslím, že dnes se již tento typ zvukovek (resp. jejich ovladačů) nevyskytuje.
Druhou variantou je integrace interního „mixeru“ zvukovky do prostředí DAW, což má například Steinberg u svých modelů řady UR/AXR, které disponují vlastním DSP, ve spojení s Cubase/Nuendo. Funkce zde spočívá v tom, že při práci v Cubase přestane fungovat standalone aplikace dspMixFx a její dílčí prvky se „přesunou“ do prostředí DAW, kde se s nimi pracuje buď v rámci MixConsole nebo samostatných oken. Výhodou je nesporně nepřeklikávání do jiného programu a osobně jsem si na tento koncept velice zvykl (už za dob provozování zvukovky DSP Factory DS2416). Pro ilustraci dva obrázky, jak to potom vypadá:

Dá se tak mimo jiné nastavit, zdali se bude nahrávat vstupní signál tak, jak je přiveden, nebo zdali bude navíc upraven některým z efektů v rámci DSP zvukovky. Totéž platí o monitorovací „odbočce“ – s aplikováním efektu nebo bez; v případě této karty je pak ještě možnost (pouze) v monitorovací trase efektovat signál reverbem (ale opět běžícím na DSP).

SW varianta – dedikovaná aplikace

Zřejmě nejrozšířenější variantou je ale dedikovaná aplikace spolupracující s DSP zvukové karty a starající se o routing ještě před DAW. V Cubase (například) je tedy opět neaktivní zatržítko Direct Monitor v nastavení audio systému, ale paralelně s ní si uživatel spustí příslušnou aplikaci (ta obsahuje v různých kombinacích obvykle mix konzoli, propojovací matici a různé další doplňkové prvky). Zde se pak děje veškeré „routování„, neboli definování vstupních i výstupních tras, jejich případné efektování, příposlechové odbočky a podobně. Známá je například TotalMix od R.M.E., Antelope jí nazývá Control Panel, Focusrite zase Control – ale v principu je to vždy totéž, jen se liší pochopitelně vizuální provedení a samotné možnosti, které jsou dány prakticky pouze možnostmi hardware.

Výhody & nevýhody

Oba způsoby monitorování při záznamu – tj. v rámci DAW nebo přímo – lze samozřejmě srovnávat a řekl bych, že oba mají jak svoje pozitiva, tak i negativa. V případě monitorování cestou DAW je tu rozhodně výhoda poslechu nahrávaného audia s aplikovanými efekty z audio stopy (samotný záznam je ale bez nich). Pokud se VST efekty použijí na vstupní sběrnici, tak je signál zaznamenán již zprocesovaný. Nevýhodou je již diskutovaná latence, která se navíc mění spolu s rostoucím projektem (počet FX/VSTi, počet audio stop apod.). Nicvíce výkony počítačů stále rostou a již drahně let toto není úplně kritická věc (pamatuji časy, kdy tento způsob byl zcela nepoužitelný i při úplně prázdném projektu). Pokud navíc není člověk extra citlivý, tak latence do cca 10ms opravdu není postřehnutelná, takže nevadí. Přičemž systém je při tomto nastavení obvykle dostatečně stabilní i pro členitější projekty.
Využití přímého monitorování znamená hodit za hlavu jakékoli starosti s latencí audio systému. Ale také to znamená rozloučit se s poslechem zprocesovaného vstupního signálu aplikovanými VST efekty (zopakuji, že při tomto způsobu je vlastně do poslechové cesty nasměrován rovnou signál ze vstupu, případně z interního mixu zvukové karty). Svým způsobem zde může pomoci mé oblíbené DSP; pokud tímto hardware disponuje, budou v jeho možnostech určitě alespoň základní efekty typu kompresor, EQ a reverb, někdy též i kytarové aparáty – takže pro alespoň přibližný „feeling“ při nahrávání je toto také víceméně splněno. Navíc existují hráči/zpěváci, kteří do odposlechu procesovaný signál nevyžadují, čili těm pak stačí i možnosti levnějších zvukovek. Tady je to o přístupu a úhlu pohledu; já zastávám názor, že bez adekvátní zpětné vazby nelze očekávat rozumný výkon, neboli za mě odposlech bez efektování nemá úplně smysl.

Další varianty

Pro milovníky tzv. „outboardu“ se tady nabízí i řešení, které – minimálně koncepcí a někdy i vzhledově – má charakter „klasického obrázku studia“, a je jím HW mixážní konzole, která je předřazená zvukové kartě. Svým způsobem se jedná o stejný postup jako v případě přímého monitorování pomocí dedikované aplikace – s tím rozdílem, že zde je místo ní v hlavní roli právě ten mixpult. Odbočky příposlechu se tedy realizují na něm a jeho routovací možnosti určí, co se bude posílat kam. I to efektování příposlechu je v mnoha případech použitelné, neboť mixpulty zhusta obsahují interní efektovou jednotku. Navíc pro hobby účely nemusí být tahle část nijak rozměrově veliká, takže ani nezabere moc místa; nicméně je třeba pamatovat na to, že mikrofon je zapojen do něj a kvalita nahrávaného signálu je pak (technicky) určena kvalitou jeho preampu a výstupu. Takže vyloženě levný mixpult bude s velkou pravděpodobností více šumět, případně mít jiné neduhy (ve srovnání s několikanásobně dražšími bratříčky) a můžete se tak spolehnout, že zvuková karta všechno toto velice pečlivě a přesně zaznamená. Což obvykle není záměr.

Různé finesy

Reverb

Co se týče aplikování reverbu do příposlechu, tak zde se dá žít i s poněkud větší latencí, kterou už lidské ucho zaznamená (tj. více než 10ms). Je tomu tak z důvodu, že reverb je vlastně dozvuk, takže zde není potřeba mít fixování na nějakou přesnost (jako by tomu bylo například pro delay nebo kytarový aparát). V Cubase toto lze zařídit například tak, že si vytvoříte pomocnou audio stopu s přiřazeným vstupem, kam je přiváděn nahrávaný signál. Do ní vložíte v Insert sekci efekt Reverb a jeho případný Dry/Wet ovladač nastavíte na 100% Wet. Následně na této stopě aktivujete tlačítko Monitor.

Monitorování při letmém střihu

Znáte to: povedené kytarové sólo a 3 tóny před koncem špatný přehmat a je to v pytli. Samozřejmě netřeba točit vše znovu, stačí přehrát problematické místo. Slouží k tomu tzv. „letmý střih„, terminologicky se obvykle najde pod slovem „punch„. Řešit jde automaticky nebo ručně, ale to tady teď rozebírat nebudeme. Jde o to, jak mít monitoring v té části PŘED začátkem letmého střihu, protože samozřejmě se interpretovi pustí nahrávka o pár taktů před, aby byl čas se do toho vpravit. Zde je to buď o osobních preferencích (interpreta) nebo o podstatě přehrávaného materiálu. Takže lze mít monitorování aktivní i přes playback (kytarista pak hraje na podkladě toho, co již nahrál – čili slyší nejen to, ale i svojí aktuální hru) nebo se aktivuje až při vstoupení do střihu. Pravděpodobně častější bude varianta „monitorovat stále“, ale není to rozhodně pravidlo. Pro tento účel je v Cubase třeba mít pomocnou audio stopu, která bude sloužit pouze pro monitorování (pomocí tlačítka Monitor) – a bavíme se jen o Přímém monitorování pomocí ovladače. Je-li Přímé monitorování řešeno dedikovanou aplikací zvukovky či HW prvkem na ní, musí se pracovat fyzicky zde. Pak je varianta monitorování pouze při nahrávání poněkud komplikovanější, protože se nedá jednoduchým způsobem v prostředí DAW automatizovat.

Metronom (aka „klik“)

Variant pouštění zvuku metronomu do příposlechu může být opět několik a podle toho se pak provádí i celé nastavení. V případě pevného tempa i rytmu (tj. například 135 BPM při 4/4) si lze připravit audio stopu s nahraným klepáním podle zvolené šablony. Ta se pak buď pustí nebo ne do příposlechové trasy a nemusí se nic řešit. V případě konstrukce skladby, kdy dochází ke změnám v tempu/rytmu, lze mít samozřejmě také podobnou přípravu, ale tak jako tak se jedná o pevně danou věc; přijde-li v průběhu natáčení myšlenka na nějakou změnu, musí se znovu předpřipravit obsah této stopy, což bude práci docela komplikovat.
Dynamickým řešením je proto využití „tempostopy„, kterou každý DAW disponuje. Případné změny tempa/rytmu se do ní uvedou a je velice jednoduché a rychlé zapracovávat momentální změny, aniž by to významně ovlivnilo průběžnou práci. Správu časování metronomu si již ohlídá DAW, takže bez ohledu na latenci je klik (audio klik – jiný nemá smysl použít, protože latence) přesně podle mřížky a dá se na něj zcela spolehnout.
Za normálních okolností nelze (v Cubase) řešit panorámu metronomu, čili například poslat ho pouze do L nebo R kanálu. Nicméně pro tento účel tu existuje tzv. „Control Room„, v jejíž rámci se nadefinuje příposlechová trasa (Cue Mix), kde se již hlasitost a panning metronomu řeší.

Příposlechový mix

Jak jsem již zmiňoval v článku Control Room, příposlechová Cue trasa umožňuje vytvoření zcela nezávislého mixu, takže je možno splnit požadavky interpretů (méně basy, nechci beglajtovou kytaru, přidej mi víc druhý hlas apod.), aniž by se zasahovalo do aktuálního nastavení MixConsole a rozbily se tak do té doby vyladěné poměry jednotlivých stop. Cue trasy umožňuje Cubase vytvořit až 4, takže v případě jejich stereo využití je potřeba mít 8 výstupů ze zvukové karty, které tyto odposlechové trasy obsadí.

Závěrem

I když je to nepopulární, tak se stejně ve finále sklouzne k tomu, že je to v nezanedbatelné míře i o penězích – byť se rok od roku ty rozdíly stírají více a více. Již nějakou dobu jsou v nabídkách různých výrobců „malé“ zvukovky, které jsou ale provedeny velice kvalitně (použité preampy či AD/DA převodníky jsou například shodné i s vyššími modely v jedné řadě), takže už dávno neplatí to, že kvalitní hardware je v téhle kategorii ten rozměrově větší a finančně nákladnější. Audient, UAD, MOTU, SSL a další výrobci mají v portfoliu príma modely přesně pro nenáročná studiová použití (co se konektivity týče například), které si ale nijak nezadají s výrazně vybavenějšími zvukovkami. I zde lze najít třeba i ADAT vstup, takže taková v základu 2 vstupá karta se dokoupením externího preampu s 8 vstupy a ADAT rozhraním rázem stane 10 vstupou, což už pokryje i nahrávání klasické bicí soupravy. A takový převodník se dá sehnat i za částku výrazně nižší než je pořizovací cena samotné zvukovky, čili opět není nutné, aby se „rozrůstající“ hobbista finančně zruinoval.
Celkově bych řekl, že to je nejen na začátku, ale potom i v průběhu profesního růstu hlavně otázka určitého kompromisu mezi ideálními požadavky a investovatelnými prostředky. Není přece nutné začínat na 8 (či více) vstupé zvukovce s tím, že hlavní objem práce jsou MIDI stopy a virtuální nástroje; tam by toto bylo zcela mimo smysl. Ale je určitě více než vhodné uvažovat minimálně nad variantou nejbližšího rozšíření – a podle toho volit aktuální typ. Takže nepořídit například malou zvukovku jen proto, že veškerá práce probíhá s VSTi a maximálně se semtam do toho něco nazpívá; pokud je nemalá šance na rozvoj směrem k nahrávání 1-2 HW nástrojů a podobně, tak má smysl poohlížet se po modelu, který má například zmíněný ADAT vstup a zaručuje tak budoucí rozšíření při výrazně menší investici (a odpadá i starost s prodejem nevyhovující zvukovky). Ale tohle si už každý musí zhodnotit sám.

© 2023 Pavel „pavlii“ Kappler

3 komentáře: „Monitorování při záznamu

Napsat komentář