pátek 10. července 2009

Ryzlinkový experiment i s vínografy

Jeden z účastníků ryzlinkové degustace, který má přeci jen poněkud větší zkušenosti s analýzou podobných věcí (je to doktorand botaniky momentálně se zabývající právě sběrem a zpracováním dat pro výzkumnou práci na téma „populační biologie rostlin infikovaných systémovými patogeny“), mne požádal o surový (a anonymní) soubor údajů, ze kterého jsem čerpal pro článek „S vůní petroleje aneb ryzlinkový experiment“. Upravil si to do vhodné formy, prohnal softwarem a vytvořil několik zajímavých grafů, které si zde dovolím i s komentářem uveřejnit. Vidíte to, degustující, přispíváte k téměř vědeckému výzkumu! :o)

… posílám nějaké obrázky z mnohorozměrných analýz. Jejich čtení chce sice trochu cvik, ale dá se to. V zásadě – všechna data se nasypou do programu (pro zasvěcené Canoco), upraví se škály, aby byly mezi vlastnostmi srovnatelné, a pak se udělá analýza. Program zjistí, ve kterém směru toho n-rozměrného prostoru je nejvíc variability a tu odečte z dat (to je tzv. první osa) a pak se postupuje stejně dál. V zásadě první tři osy nesou nejrozumnější informace. Když se člověk na toho ježka podívá, tak ty šipky, které jsou spolu jedním směrem, hodně korelují. Které jdou opačným tak korelují negativně, které jsou kolmo, tak jsou +/- nezávislé... ale tady je háček, všechny ty šipky se jaksi vzájemně ovlivňují, takže to nelze brát na úplně na 100%. A když se vynese třeba graf 1 a 3 osy, tak to zase bude vypadat jinak. Jen pro úplnost v téhle analýze bylo zjevně málo nezávislých vzorků (odborně se tomu problému říká pseudoreplikace), správně by se taková analýza ani neměla dělat, ale to neznamená, že nemůže ukázat nějaké zajímavé trendy.

Vlastnosti: tohle je taková základní analýza (PCA), která nebere v potaz ani vzorky ani lidi, čili je to jenom o korelacích mezi vlastnostmi v celém tom souboru dat (jedním měřením je jeden názor člověka na jedno víno). Graf znázorňuje první (x) a druhou (y) osu. Je tu vidět třeba to, že typické ryzlinky jsou podle účastníků minerální, medové a i docela petrolejové, ovocné a květinové chuti šly obvykle spolu, kořenité naopak s nimi nešly atd...

Vlastnosti 1-3: analýza první a třetí osy (y), je to proste jenom náhled na jinou složku těch dat, tu další nejdůležitější. Posílám spíš pro ukázku, že ty grafy se musí číst opatrně.

Vína a vlastnosti: tohle už je zajímavější, tady byla data jaksi napasována na pohled „rozdíly mezi víny“ (je to tedy RDA) a naopak rozdíly mezi lidmi byly odsud odfiltrované. Šipky jsou tudíž trochu jinak orientované než u předchozích, ale v zásadě se v tom dá číst, které víno mělo jaké charakteristiky v tom souboru - Anakena barva a petrolej, Loosen lipové, Baloun tak od všeho trochu nebo spíš každý v něm viděl něco jiného. Třeba ta Roudnice je zajímavá, ze je brána jako naprosto netypicky ryzlink a spíše bez nějakých zásadních znaků, ale to může být zavádějící, protože možná s něčím koreluje na třetí ose a tak… :-)

Hodnotitelé: toto je naopak analýza bez vlivu vzorku vína a ukazuje, kteří degustující hodnotí vína podobně...

Nenapadlo by mne, že se jednou budu bavit u podobných věcí, jako je graf intenzity chuti vína, co dává na své lahve Vinium. Což mi připomíná… nechcete si na příští akci něco takového nakreslit? :o) Pro účastníky ochutnávky, ze které vzešla data v grafech výše, je zde samozřejmě nabídka, že jim zašlu jejich číselný kód, pokud je zajímá, jak si v té tabulce stojí. H7 s H9, H1 s H11 či H6 s H10 se k sobě očividně „ryzlinkově“ hodí :o) Příjemný víkend všem, ať až mají na grafu s někým shodné chutě, nebo jsou trochu „mimo“…

Komentáře používají Disqus