2013. január 9., szerda

nemlineáris videoszerkesztés ingyenes eszközökkel

Mi a videoszerkesztés feladata?

A nemlineáris editorok, szerkesztők olyan eszközök, amelyekkel a nyersanyag-elemekből előállíthatunk egy kész filmet. A lineáris szerkesztéssel ellentétben a videoklipek egymáshoz képesti sorrendje tetszés szerint változtatható, a végeredmény nem csak a felvételi sorrendnek megfelelő lehet.

A videó képkockák sorozata, amelyhez hangsáv(ok) is tartozhat(nak). A képkockák képpontokból állnak. A szerkesztőprogram azt teszi lehetővé, hogy ezek a képpontok és képkockák az eredeti állapotukhoz és sorrendjükhöz képest (akár nagyon bonyolult módon) mássá alakuljanak.
A végeredmény és a forrásanyagok is időben léteznek, ezért leírásukhoz időbeli koordinátákat használnak. Ez lehet időalapú vagy képkocka-alapú. A timecode leggyakoribb beállítása az óra, perc, másodperc, és képkocka beállítás (HH:MM:SS:FF), mivel azonban a framerate, vagyis a másodpercenkénti képkockaszám formátumfüggő (moziban 24, PAL rendszerben 25p vagy 50i, NTSC rendszerben 29.97p, illetve 60i), az egészen pontos időzítést az ezredmásodperc-alapú időkódtól várhatjuk.

Az, hogy az egyes nyersanyag-darabkák milyen sorrendben határozzák meg a végeredményt, szerkesztőprogramonként másképp alakul. Az audio és a video előállításának folyamata a profibb eszközökben általában különválik. Egyszerűsített szabályként a következőképpen gondoljunk a szerkesztés menetére:

klip->manipuláció->manipuláció2->manipuláció...         \
klip2->manipuláción->manipuláción+1->...                     -> kompozitálás  -> manipulációm->
...                                                                                       /

vagyis az egyedi elemek külö-külön sok módosításon eshetnek át, ezen módosított elemek összekombinálása (kompozitálás) után az eredmény is még módosítható stb.
Profibb eszközökben e szintek és csoportosítások egész bonyolult halmazokba rendezhetők.

A folyamat

A videoszerkesztés folyamatát a következőképpen célszerű felfognunk:
0. (tehát még a szerkesztés előtti) lépés: Nyersanyag létrehozása, beszerzése (kivéve a szerkesztő által generált médiát)
1. Nyersanyagok beolvasása a szerkesztőbe (média, ide értve videoklipeket, audioklipeket, állóképet, generált médiát /pl. minta vagy felirat/)
2. Nyersanyagok manipulálása (átalakítás, rövidítés, nyújtás, effektek, keverés, színkorrekció stb.)
3. Nyersanyagokból végeredmény összekombinálása
4. A végeredmény kiírása felhasználási céljainkhoz illeszkedő formátumba

1-3. A szerkesztési folyamat hatékonyságának támogatása (pl. szabványos kódok, konzol-támogatás, billentyűzet shortcutok használata, szerkesztési formátumok támogatása, átjárhatóság más eszközök felé, mentés, projektek kezelése, média-adatbázis) a szerkesztőprogramok szolgáltatása, ezekben jelentős eltérések vannak, és nem utolsósorban ezek különböztetik meg a professzionális eszközöket a hobbiprogramoktól.

A lépések 

Filmforgatás, zeneszerzés, fotózás, animációkészítés

A 0. lépés önálló kreatív folyamat, egy másik posztban írok külön a videokészítésről, az állóképek készítéséről, illetva a hanganyag előállításáról. A professzionális szerkesztők sok olyan beépített szolgáltatást nyújtanak (pl 5.1-es keverés vagy 3D szerkesztés), amelyek általában külön feladatként és fázisként jelennek meg, de ezekkel ebben a posztban keveset foglalkozom. 

Import, Open, Capture, Generated media


Az 1. lépésben tapasztalatom szerint a legfontosabb a különféle formátumok kezelése; ha az általunk használt szerkesztő nem támogatja a forrásanyag formátumát, konverziót kell végrehajtanunk. Arra ügyeljünk, hogy lehetőség szerint ne veszteséges konverziót csináljunk, mert a minőségromlás rettentően idegesítő lehet, és a munkánk nagy részét tönkre is teheti!

(A konverzió gyakorlati végrehajtásához számos ingyenes segédeszköz rendelkezésre áll, mivel az algoritmusok viszonylag kiforrottak, az ingyenes eszközöktől is jó eredményt várhatunk, feltéve, hogy jól állítjuk be a paramétereket. Két ilyet próbáltam, ezeket ajánlani is merem: VSDC video converter és SUPER(c).)

Az is segítség, ha a szerkesztő támogatja video beolvasását közvetlenül a videokamerából (Capture), illetve hang rögzítését az audiosávra. Ez utóbbival csak akkor járunk jól, ha az audio szerkesztési funkciók fejlettek, egyébiránt jobban járunk külső eszköz (pl. Audacity, Soundforge) használatával.
A generált média általában hátteret, szerkesztési mintákat, feliratokat kínál. Míg az állókép-jellegű elemeket képszerkesztővel is előállíthatjuk, a mozgóképeket nem, tehát érdemes keresni ezt a szolgáltatást az editorban.

Különösen fontosnak tartom a feliratkészítő funkciót, mert a felirat (és a stáblista - credit roll) önmagában is látványos vizuális elem egy jó klipben.
 


A kreatív munka dandárja a 2. és 3. lépésben zajlik.

A klip első szintú módosítása: Trimmelés, crop (pan&zoom&rotate), mask, effektek

A 2. lépésben az egyes médiadarabkákkal dolgozunk. A szerkesztők zöme nyújt manipulálási és testreszabási lehetőséget.
Állóképek manipulációjában általában képszerkesztő és rajzolóprogramokkal lehet a legjobb hatást elérni. Az állóképet úgy tekintsük, mint egy olyan videoklipet, amelynek minden képkockája ugyanaz.
A klipekkel való munka első lépése az időbeli hossz megváltoztatása, a trimmelés. Egy hosszabb klipből egy bizonyos rövidebb részt gyakran kiveszünk, vagyis a használandó klip az eredetinél rövidebb ideig tart. A mai szerkesztők képkocka pontossággal határozzák meg azokat a pontokat (marker), ameyekhez képest egy szerkesztési lépés végrehajtódik. 
Feltétlenül legyen a szerkesztőnknek olyan funkciója, amellyel egy hosszabb klip megadott ponton kettévágható (split). 
A trimmeléssel gyakran külön subclipet hozhatunk létre, amely önálló médiaelemként menthető el. Ez nem mindig hatékony, tárterületet igényel, és nehéz követni, melyik klipre lesz szükségünk. Jobb megoldás, ha az eredeti médiafájl változatlan, és a szerkesztő megjelöli, mely részét kívánja használni.
Ezekhez a feladatokhoz kapcsolódik az is, amikor az eredeti klip egy másik részét szeretnénk időben ugyanazon a helyen felhasználni (mintha egy kereső alatt húznánk a videoklipet, míg a kívánt szakasz nem jelenik meg - slip), illetve amikor a kijelölt klip-részt időben máshová csúsztatjuk át (slide).
Egyes szerkesztők az időbeli manipulációk között felkínálják a zsugorítás/nyújtás funkciókat, ekkor a lejátszás sebessége gyorsabb/lassabb lesz, és természetesen kevesebb/több ideig is tart majd.

A többi funkció egy adott időpontban érvényes állapotot jelöl, ám a haladóbb szerkesztők lehetővé teszik azt, hogy a beállítások időben változzanak. Ez óriási segítséget jelent, magasabb színvonalú eredményhez nélkülözhetetlen. A beállítások időbeli változtatását kulcskocka alapú animációnak nevezik (keyframe animation), és az editor segít nekünk abban is, hogy csak meghatározott pontokon kelljen a kívánt étékek beállításával bíbelődni, a köztes időpontokra vonatkozó értékeket egy megfelelő összefüggés segítségével (általában megválaszthatjk a görbét, lineáris, vagy másod-, harmadfokú görbe is rendelkezésre szokott állni) a program kiszámolja. A kulcskockák hozzáadása végezhető kézzel, illetve kérhetjük, hogy a paraméter megváltoztatásakor automatikusan készüljön egy keyframe.

A kulcskocka alapú animáció véleményem szerint a haladóbb funkciók egyik nélkülözhetetlen eleme. Ennek hiányában legalább a paraméterek időbeli változtatásának lehetőségét kell keresnünk. Ha egyik sincs, a szerkesztőprogram használhatósága jelentősen korlátozott.

A crop (kivágás) funkcióval levágható a videoklip egy része, vagyis egy látható ablakot jelölhetünk ki. A kijelölés többnyire időben változtatható, és az is előírható, hogy az ablak kitöltse-e a teljes képernyőt, illetve az oldalarány megtartása, az ablak elforgatása és elmozgatása (mindez persze időben változó állapotot feltételezve) olyan hatást keltenek, mintha zoomolnánk (crop - ha például egy kis részét jelöltük ki az eredeti klipnek, és kitöltjük vele a képernyőt, akkor közelítést érzünk), svenkelnénk (pan - elmozgatjuk az ablakot, a látvány is beúszik a képbe), billentenénk (rotate - a kép síkját is elfordíthatjuk), illetve ezek a mozgások kombinációban is megjelenhetnek.
A crop funkciókat önmagában is lehet alkalmazni, de leginkább a kompozitálás előtti műveletnél jön jól, amikor elő kell készíteni az egyes összetevőket.
A mask (maszkolás) eszközzel a kép bizonyos részeit (pixeljeit) jelölhetjük ki, amelyek az adott klipből különleges kezelendők - ez legtöbbször azt jelenti, hogy nem lesznek lejátszva. 
A maszkolást a legegyszerűbb szerkesztők nem ismerik, de kicsit haladóbbakban már gyakran találkozhatunk vele. Rajzeszközökkel jelölhetjük ki a maszkolandó területet (téglalap, ellipszis, szabadkézi, poligon, bezier-görbékkel határolt idom).
A maszk időbeli változtatásával számos kreatív eredmény érető el: a rotoscoping (amikor egy mozgó tárgyat például átszínezünk), a sin-city hatás (egy szürkeárnyalatos képen csak egy meghatározott objektumnak van színe), a chroma keying vagy blueboy/greenbox hatás (amikor a stúrdió háttér előtt felvett klipben a hátteret kicseréljük.)

Az (audio és video) effektek (FX, effects, plug-ins) a legtöbb szerkesztőben rendelkezésre állnak, bár nem mindig paraméterezhető formában, és csak a haladóbb megoldások kínálnak lehetőséget az időbeli változtatásra. Az effektek alapesetben egy kliphez rendelhetők. Az effekteket lehetőségünk van egymás után csatolni, és a végeredmény gyakran függ a sorrendtől is. (például egy piros szín kiemelés és egy szürkeárnyalatos szűrő egymás után sorrendtől függően egészen különböző eredményt ad.)
Az effektek hatását általában befolyásolja a maszk is, és a haladóbb eszközök a kulcskocka alapú animációval igen látványos eredmények létrehozását tudják támogatni.

Eebben a szakaszban tehát trimmelés és pozicionálás után a crop, mask, FX-lánc funkciók végrehajtásával tudunk előállítani egy olyan elemet, amelyet a végső videoklipben majd összetevőként felhasználunk.

Egy különleges, ebbe a szakaszban tartozó feladatot meg kell említenem, mert az igazi filmgyártási folyamatban rendszeresen előfordul, nehéz, és támogatása csak profi eszközökben található meg. Ez pedig a színkorrekció vagy színelés.
Mivel a filmünk történetében egymás után vagy egyszerre, azonos helyszínen történő cselekményeket a valóságban nem ugyanakkor vesszük fel, a fényviszonyok is változhatnak, még gondos bevilágítás mellett is (anélkül pedig garantáltan), ami a színhőmérséklet, a színárnyalatok különbségét eredményezheti. pl. a kép egyik részén még rózsaszín kanapéról rugaszkodik el a macska, de az érkezés a kanapé másik végén már egy élénkpiros bútort mutat. Ezek általában nem kívánatos, és felvételkor észrevehetetlen, lejátszáskor zavaróan jól látszó különbségek. A színelésnél a kép pixeleihez rendelt színtartományok finomhangolását végezhetjük, sok-sok beállítási lehetőséggel, amíg a kívánt eredményt el nem érjük.

A módosított klipek használata: időtengely vagy storyboard alapú szerkesztés, kompozitálás 

A 3. lépés feladata az elemek kombonálásával a végeredmény megszerkesztése. 
A végső videó az időben haladó képkocka-megjelenítés, logikus tehát, hogy valamilyen módon az időbeli koordináta folyamatosan szem előtt legyen. Ezt a célt szolgálja a legtöbb szerkesztőnél megtalálható időtengely (timeline), amelyen képkockák szerinti, vagy a képes forgatókönyv (storyboard), amelyen jelenetek szerinti felosztásban láthatjuk, mi minden történik majd egymás után. A továbbiakban az időtenglyes munkáról beszélek a másik változat hasonló logikát követ, egészen apró eltérésekkel, amely inkább csak a nézet kényelmét szolgálja.
Az időtengelyen való munka könnyebbé tételét sokféleképpen segítik, zoomolni lehet rajta, vonalzót láthatunk, kijelölési lehetőséget kapunk, egyidejűleg több klipet tudunk megfogni és műveletet végezni velük stb. Az időtengely mellé réndezve láthatók az úgynevezett sávok (track).
Egyes szerkesztők több sáv kezelését is támogatják. Az egymás fölött levő külön-külön sávok úgy foghatók fel, mint ugyanazon időpontban egyszerre megjelenni kívánó klipek. Hogy a sávok adattartalmából mi jelenik meg a végeredményben, nos, pontosan az a kompozitálás feladata.

A közepes fejlettségű eszközöknél egy videoklipsáv van, amely mellett több audiosávot is felkínálnak, esetleg a klip audiosávja mellett külön keverhető zenei és narrációs sávot. További szolgáltatásként találhatunk feliratok vagy egyéb objektumok (ábrák, nyilak, szövegbuborékok stb.) elhelyezésre szolgáló önálló sávot (overlay, title, text stb.)
A haladó eszközök a videosávokból is többet kínálnak, ezeknél a speciális videosáv az overlay, illetve szöveg számára általában felesleges, hiszen ezeket általános videosávra is tehetjük (kivéve, ha a generált médiát az eszköz nem támogatja másképpen, csak speciális sávval).

A sávokkal való munka legáltalánosabb eleme az időbeli átmenet vagy átcsúsztatás (transition). Ezt kivétel nélkül minden mai szerkesztő támogatja valamilyen módon, a legegyszerűbbek beépített, automatikus megoldással, az egyre haladóbbak minél több kézi beállítást felkínálva.
Az alapszintű szerkesztők az egymást követő klipek átfedő részeire (vagy stroyboard módban az egymás utáni jelenetek közötti transition-összekötőre) beilleszthető, katalógusból választható áttűnést kínálják fel. Itt általában kevés paramétert adhatunk meg, az áttűnés hossza azért rendelkezésre szokott állni. A leggyakrabban használt átmenetek: vágás (cut), elhanyválulás (fade out, fade to color), felerősödés (fade in, fade from color), áttűnés (crossfade, dissolve). 

A profi filmkészítésben ezektől eltérő átmenetek ritkán fordulnak elő, és tulajdonképen a maradék megoldások zöme effektek és kompozitálás segítségével könnyen elő is állítható.

Az sávok támogatják azt is, hogy a sávon elhelyezett minden klipre egységesen alkalmazzunk: effektet / némítást / szóló lejátszást. 

A profibb eszközök lehetővé teszik, hogy egy klipnek több felvételváltozata (take) is felhasználható legyen. A felvételek ugynaúgy (csak egyszeri munkával) vannak megszerkesztve, és a rendező a végső környezetében nézheti meg, melyik változat mutat legjobban a készre szerkesztett videóban.

A sávokkal való munka legnehezebb része a kompozitálás. Ebben az esetben arról beszélünk, mi jelenik majd meg az egymás alatti (tehát térben különböző, de időben akár egyszerre érvényesülő) sávokon elhelyezett klipekből.
A sávok sorrendje általában láthatósági sorrend, a felül levő sáv alapértelmezetten kitakarja az alatta levőt. A láthatóság azonban ennél bonyoultabbá is válik:
1. A láthatóság pixelenként működik
2. A videosávokhoz gyakran átlátszóság rendelhető
3. Ahol egy felső sáv átlátsző vagy hiányos (crop/mask), az alulról érkező képinformáció jelenik meg
4. A sávok kompozitálási módja az egyszerű átlátszáshoz képest (alpha) más is lehet (erősítés, összegzés, kivonás, gyengítés, invertálás, szorzás stb.) így képpontonként végezve a műveleteket a végeredmény bonyolult módon határozódik meg.
5. A kompozitálás alapesetben alulról indul, egy felsőbb sáv kompozíciós módjától függően veszi figyelembe az alsóbb sáv pixeljeit, így alakul ki a saját pixeljeinek értéke, amit a felette levő sávok vesznek figyelembe sít.
6. Akárcsak a matematikában, a kompozitálási algoritmusoknál sem minden művelet sorrendje cserélhető fel. Ennek megfelelően a kompozitálásra is érvényes lehet egyfajta "zárójelezés" (ezt child-parent viszonyok támogatásával nyújtja a szerkesztő program)
7. Audio sávok esetén a hangok nem fedik el egymást, hanem egy keverőn keresztül egyszerre szólalnak meg. A haladó szerkesztőprogramok bizonyos mértékű audiostudió-szolgáltatást is nyújtanak, effekt-lánccal, térhatású hangzással.

Vigyázzunk, mert bizonyos programoknál az egymás fölött elhelyezkedő videosávok mindössze átmenetek definiálását támogatják - ez nem igazi kompozitálás.

Mentés, renderelés

A 4. lépés a végeredmény előálltása. 
A projektet (milyen médiaelemeken milyen változtatásokat hajtunk végre és ezek hogy kobinálódnak) folyamatosan mentjük. A zárójelben szereplő tudnivalókat EDL (Edit Decision List) írja le. Ezeket a döntéseket szabványos formába rendezett, más szerkesztőprogramok által is megérthető módon ki lehet menteni, és máshol (vagy más által) lehet folytatni a munkát. Egy igazi projektnél ennek nyilvánvaló előnyei vannak.
A végeredményt exportálni kell videolejátszó által is ismert formátumba. Ez a folyamat a renderelés. A renderelésnél a kiválasztott minőség és formátum követelményeinek megfelelően az elemekből az összes transzformációval előállítandó végeredmény (képpontról képpontra, kockáról kockára) kiszámítása és kimeneti fájlba írása történik.
Ez egy számítás- és I/O -igényes folyamat. Erősebb géppel, renderelő farmmal, gyorsabb merevlemezekkel rendelkezők előnyben!

Akárcsak az importálásnál, itt is fontos, hogy minél több szabványos kimeneti forma támogatott legyen. A PAL/SECAM, DVD, HD, Full HD manapság alapkövetelmény, de az iPhone, iPad, Youtube, 3D lejátszás támogatása sem elhanyagolható.
Bár a kimeneteknél gyakran kapunk paramétereket a testreszabáshoz, ezeket ne állítgassuk tetszés szerint, csak ha értünk hozzá, és feltétlenül szükséges.

A szerkesztési munkát segítő eszközök

A preview window, vagyis előnézeti ablak, a változtatható sebességű lejátszás, a látott kép kimerevítése és fájlba menése, tartomány kijelölése, több sáv esetén tartományok és sávok egyöttes jelölése, klipek csoportosítása.
Kulcskocka alapú animáció.
Klip időtartamának nyújtása, zsugorítása.

(folyt. köv.)



2012. október 20., szombat

Leonar3do

Láttam a leonar3dot működés közben. Hasznos eszköz, oktatásban kifejezetten jól alkalmazható  lesz. Hajrá!

2011. június 6., hétfő

the flaws of watson

You remember the Final Jeopardy! in the first round?
US cities category was on the board, and Watson - I admit, indicating his doubt (??? why a male personality? forgive me, his name is masculine) with the rings circling way at the bottom of "his face" and a bunch of question marks - attempted Toronto as the answer.

Well, after his impressive debut this was shocking.
Little did it help - I would say, at first sight it made it worse - that David Ferrucci explained there were some Toronto cities also in the US. At second sight, to the scientific mind it really mattered, but for the ordinary audience it might looked like marketing-explaining a product bug.
Well, let us not forget that Watson is a machine and also a scientific experiment. Or case study. Or worload-optimized, special purpose system. In that regard, his mistake is important and fruitful. So is Ferrucci's explanation.
Let me elaborate on this a bit.
If Watson had simply won without any mistakes one would assume he really "knew" what he had been asked, and what it meant. In the light of this "Toronto" and some other guesses he made (though he did not reach the confidence level needed to press the button (to attempt to answer), the response candidates were visible throughout the entire game) we now he had little clue about what was going on.
And let's emphasize, Ferrucci also said Watson did not "think" and "understand" as humans do, instead, it can process human language.
And that is a significant difference, much like how birds and airplanes differ.
Can we use airplanes to fly? No doubt.
Now, with Watson's mistakes we try to understand what and why he can "understand" (process precisely), and where he is completely clueless.
It occurs, that during the training process Watson learns not only semantics but also some general knowledge which is used to disambiguate possible meanings. People do the same when we understand what we are told.

Still, there is a long way to go.
Not only with Watson - which (who) is amazing - but in machine natural language processing in general.
I have no idea when (if at all) machines will admire poetry, humour and riddles.