18. 11. 2013

Konečně relevantní hodnocení her!

Zbožňuju hodnotící tabulky her. Zejména ty z Excaliburu - jak byly úžasně komplikované a vymyšlené. Velice mne mrzelo, když pak Score začalo tabulky zjednodušovat na pouhý verdikt a jedno číslo. Jasně, mělo to své opodstatnění kvůli relevanci, ale spotřebitel naopak ztratil možnost hry jednoduše srovnat vedle sebe, třeba za poslední tři měsíce. Nakonec mu tam vyleze pár osmiček a devítek, kvůli kterým nedostanou šanci hry sedmičkové či slabší, přestože by spotřebitelově vkusu seděly mnohem více. Jak se z toho dostat? Hleďte níže - můj návrh na revoluci v hodnocení her! (A čehokoli jiného).



Hodnocení má tři různé elementy, které se spojí v jeden na konci recenze. První element je určitá objektivizace hra jako takové. Recenzent na základě žánru, stylu hraní, obsahu hry a podobně, vypracuje seznam vlastností, které hra objektivně má (nebo se je snaží je mít). Toto nesouvisí s žádným hodnocením, jde jen o vytvoření chlívků, které později budeme vyplňovat.

Například GTA5 se dá objektivizovat asi takto:

grafika
hudba
hlavní postava
příběh
fyzika vozidel
herní doba
uvěřitelnost světa
stavba misí
cena

Jsou to jakási klíčová slova, která se snaží hru charakterizovat co nejobjektivněji. Je zřejmé, že nemůže existovat předem daný seznam, počet položek také není ničím omezen. Jde jenom o to, aby recenzent stanovil ty elementy hry, které bude později hodnotit. Různí recenzenti by teoreticky měli dojít k plus mínus stejnému seznamu položek - ale samozřejmě i při pokusu o objektivizaci se nevyhneme subjektnímu pohledu na věc, takže některé věci se budou od každé recenze lišit. Naopak ale některé položky budou prakticky neměnné v čase - třeba to, že hry jsou pořád software, takže musí mít nějakou svou funkci a také rychlost. Grafika se dá rozdělit na technologii a art, podobně tak zvuk - a tohle se bude vyskytovat, jako kriterium hodnocení snad u všech her.

Nyní přikročíme k druhému kroku. Ohodnotíme jednotlivé složky hry a to binárně - buď je daná věc zvládnutá dle představ recenzenta, anebo prostě není.

V případě GTA5 bych to viděl asi takto:

grafika 1
hudba 1
hlavní postava 1
příběh 0
fyzika vozidel 0
herní doba 1
uvěřitelnost světa 1
stavba misí 0
cena 1

Zde je prostor k první vlně subjektivní kritiky, kterou si už každý recenzent musí odargumentovat sám. Mně třeba přijde, že příběh nebyl úplně dotažený do konce, že vozidla mohla pobrat více realismu (jsem proti otáčení aut z krovek na kola) a že většina misí nenaplnila to, co mohla - rádoby nelineárních heistů je málo a jsou málo rozdílné, vyjma úplného konce hry jsou mise lineární (byť velice zábavné).

Celé to ale završíme ještě třetím krokem - recenzent určí, které z jednotlivých aspektů hry jsou pro něj osobně stěžejní natolik, že se propíší do hodnocení hry?

grafika 1
hudba 1
hlavní postava 1
příběh 0
fyzika vozidel 0
herní doba 1
uvěřitelnost světa 1
stavba misí 0
cena 1

Opět jde o osobní sondu - od GTA5 jsem očekával a dostal kvalitní grafiku, tak mi vyrazila dech. Hudba je tam sice padnoucí, ale i kdyby tam hudba nebyla vůbec, nijak by mi to nevadilo. Podobně tak - jsem rád za výrazné postavy, ale samotnou story vnímám naprosto okrajově - hra je pro mne hlavně obrovským sandboxem, který zkoumám po mnoho desítek hodin. Pak je mi i celkem putna, že mise nejsou zrovna dokonalé. Oproti tomu ale podivné chování aut (byť herně odůvodnitelné) je něco, na co narážím pořád a štve mne to i po dvěstě hodinách.

Ve finále tak GTA5 dostane číselné hodnocení: 4/5. Z pěti zásadních složek hry bych dal palec nahoru čtyřem z nich.

Dává to smysl? Pokud ano, uděláme krok dále. Jak udělat z této informace relevantní informaci pro spotřebitele?

Představte si, že nějaký velký server typu Gamespot, hodnotí takto hry. Spotřebitel se přihlásí na svůj účet, ve kterém má už předem vyplněno, že u her například preferuje kvalitní příběh, že ho zajímají realisticky ovládaná vozidla a že si potrpí na kvalitní hudbu i grafiku. Samozřejmě - to samé se dá použít při vyhledávání hry. Ta samá recenze na GTA5 pak vyzní takto:

grafika 1
hudba 1
hlavní postava 1
příběh 0
fyzika vozidel 0
herní doba 1
uvěřitelnost světa 1
stavba misí 0
cena 1

Tedy dle nějakých obecných požadavků spotřebitele dostává hra hodnocení 2/3.

Tento systém lze i prohloubit. Každý objektivizační element by měl svého přirozeného oponenta. Například "uvěřitelnost světa 1" je de facto to samé, jako "fantasmagoričnost světa 0". Takže pokud by ten samý uživatel hledal hru s neuvěřitelným prostředím, tabulka by se automaticky změnila:


grafika 1
hudba 1
hlavní postava 1
příběh 0
fyzika vozidel 0
herní doba 1
uvěřitelnost světa 1 = fantasmagoričnost světa 0
stavba misí 0
cena 1

A hle - máme hodnocení 2/4.

S narůstajícím počtem titulů s tímto systémem hodnocení a také s větším počtem položek v hodnocení (každá hra by mohla mít 10+ hodnotících kriterií, minihry pro mobily ale budou mít takových položek méně) pak stoupá relevance každého hodnocení pro každého spotřebitele. Co to znamená v praxi?

Hry, které mají spousty důležitých elementů jsou evidentně ambiciózní a komplexní. Číslo za lomítkem je jakési vodítko, jako moc velká hra je. Číslo před lomítkem určuje, v kolika těchto elementech hra podle recenzenta uspěla, což představuje vstup lidského a subjektivního elementu hodnocení. Lze z toho usoudit, že hra s hodnocením 4/7 je v jistém smyslu hodnotnější, než hra s hodnocením 2/3 (sedm klíčovýh položek VS tři klíčové položky), leč druhá zmíněná hra je celkově kvalitnější (dvě třetiny elementů hry jsou dle recenzenta zvládnuté, kdežto první jmenovaná hra má zvládnutou jen polovinu a kousek). Spotřebitel tak snadno odhadne, podle toho co hledá, jaký titul mu je více padnoucí.

Počet položek hodnocení se nesmí nijak neomezovat, dokonce bych některé položky přidával "post mortem", třeba až po roce hraní (v případě nějakých MMO her), rovněž by bylo zajímavé hodnocení časem měnit a rozšířovat ať už z hlediska vyspělosti recenzenta anebo vyspělosti dané doby. Recenzent by pak řekněme každoročně revidoval své hodnocení, aby zachytil, nakolik se hra mění v čase. Některé položky mohou být třeba určeny, ale nehodnoceny, čekajíce na nějaké rozseknutí postupem času. Aby hodnocení bylo relevantní, musí se logicky v čase měnit. Stejně, jako se mění postoj recenzenta postupem času. Od určitého časového odstupu by se vývoj hodnocení mohl zastavit, ale to už je kus od kusu.

Stejně tak, když se sejde více recenzentů k jedné hře (napříč několika magazíny a herními portály), bude zajímavé srovnávat jejich vkus nejen volbou objektivních položek, ale také konkrétním hodnocením. Spotřebitel si pak dá recenze vedle sebe a brzičko mu vyplyne na povrch, který konkrétní recenzent je jeho srdci nejbližší.

Popravdě mne tento styl hodnocení napadl po té, co jsem více rozehrál Shinobi na 3DS. Tam je ta grafika natolik ostudná, že je to skoro na řeknutí - ale v tom výsledku mi vlastně neovlivňovala můj zážitek ze hry, protože ta konkrétní hra o grafice prostě není. Podobně tak jsem vedl vášnivou diskuzi o příběhu v GTA5, kdy jsme se sice shodli v tom, že mohl být lepší, ale přesto jsem trval na tom, že to hru nekazí (na rozdíl mého oponenta). A právě systém třífázové tabulky by to mohl rozseknout i pro pouhého diváka takové diskuze.

V jádru věci nejde o nic jiného, než o rozdělení recenze na elementy a jejich označkování. Třeba já když píši nějakou recenzi, snažím se, aby jeden odstavec (anebo rodina odstavců) komentovala jednu specifickou část hry, než přejdu k další. A tak bych vlastně mohl nasázet jedničky a nuly k těmto informačním blokům a na konci to pak shrnul. Stejně tak Gamespot (a mnoho dalších webů) doplňuje známkování také ikonkami "Oh snap", "Undeniable charm", "Weak story" a podobně - z těchto ikonek by se zkrátka vyextrahovaly položky hodnocení a následně přidělily jedničky či nuly.

Co si o tomto systému myslíte vy? Mělo by smysl to někde nasadit?

5 komentářů:

  1. Promin, ale tohle je blbost. Uz jen samotny skatulkovani jednotlivejch faktoru her, jenom aby nam na konci vyslo to bozske cislicko, podle kteryho urcime kvalitu cely hry za dve sekundy je bohuzel stoupajici trend herni sceny. V recenzi jde v prvni rade o samotny text recenze; ciselne hodnoceni je podruzne az zbytecne. Najdi si napr. recenze od Lukase Grygara a presne pochopis, o cem mluvim - ze cisla jsou picovina.

    OdpovědětVymazat
    Odpovědi
    1. Ono by to fungovalo obráceně s těma škatulkama, recenzent se nesnaží hru násilně naroubovat do nějakých škatulek, ale vytvořit vždy nové, pokud ty stávající nestačí. Postupem času by se ale začaly jisté škatulky vyskytovat častěji a reprezentovaly by jistou páteř her jako takových.

      Rozhodně souhlasím s tím, že číselné hodnocení JE blbost samo o sobě, ale že když už ty nálepky dávat, tak aby pro spotřebitele měly alespoň nějakou relevanci. Což by zdynamičtění hodnocení mohlo přinést. Teoreticky ;).

      Vymazat
  2. Stejně je to dycky subjektivní a je to jako hodnotit hudbu nebo filmy. Podívej se na ČSFD - čtyři díly Kameňáku maj od 18 do 27 procent, nejčastější hodnocení tam je "odpad!" a přesto to nejmíň třetina národa považuje za vrchol zábavy. Jak píše tle pán nade mnou - mnohem důležitější než čísla je recenze samotná a pokud někdo neumí recenzovat (potažmo vůbec publikovatelně psát), nemá vůbec smysl dávat číslům nějakou relevanci.

    OdpovědětVymazat
    Odpovědi
    1. To je myslím dobrý příklad. Pokud si spotřebitel zaškrtne, že hledá na ČSFD "odpad", tak dostane odpad, ne? ;)

      Ale rozumím - většina spotřebitelů považuje svůj vkus za natolik vybroušený, že v Kameňáku spatřuje inteligentní zábavu a v principu nesouhlasí s hodnocením "odpad". Je tedy nutné zohlednit nejen pouhé preference diváka, ale také jeho skutečné chování - jak píše pán pode mnou. Třeba že by spotřebitel zašrtával, jaké filmy viděl v kině a jak se mu líbily. Pak by algortimus jenom spojoval ony škatulky a vyjelo by mu doporučení (resp. antidoporučení od recenzenta).

      Vymazat
  3. V podstatě mi to dává smysl, protože jsem sám kdysi uvažoval nad podobným ne hodnocením z hlediska recenzí, ale z hlediska doporučovacího systému. Každý hráč by měl osobní preferenční "matici" a tu pak hledat v určitých hrách, tak aby se hráč dostal ke hře, které by on sám dal klidně 10/10, ale většina se prostě shodla na 5/10. Nicméně tu matici jsem nechtěl vytvářet na základě nejen toho, co si uživatel myslí, že ho na hrách baví a zajímá, ale i podle toho "jak se chová" (tvrdí, že mu nezáleží na grafice, ale evidentně z hodnocení tomu dává velkou váhu).

    OdpovědětVymazat