Wichtige Gewichtungen

Von Yeager · 6. Mai 2014 · Aktualisiert am 9. Mai 2014 ·
Kategorien:
  1. Ein Vorschlag für ein realistisches und faires Bewertungssystem


    Es gibt unterschiedliche Spiele-Genres, die sich durch Charakteristika auszeichnen, die für sie typisch sind. Diese können zwar auch in anderen Genres zugegen sein, spielen dort allerdings nur eine additive, untergeordnete Rolle, wenn überhaupt.

    Rollenspiele z.B. leben in erster Linie von der Welt, der Story/dem Avatar, den klassischen RPG-Elementen (wie etwa Skillbäumen, Items, ...).
    Taktik - zum Beispiel in Form taktisch anspruchsvoller Kämpfe - kann bei RPGs das Tüpfelchen auf dem i darstellen, ist aber kein "Muß".
    Das kommt auch sehr auf die Art des Rollenspiels an:
    Fehlende Taktikkomponenten würde man einem Witcher wohl eher verzeihen,
    als einem Dragon Age.

    Ganz anders bei Strategiespielen.
    Diese legen besonderen Wert auf taktisches Gameplay, Einheiten und die KI.
    Ob sie eine Story haben, dürfte die meisten Strategie-Spieler weniger interessieren.
    Niemand wird sich beschweren, falls eine (gute) vorhanden ist, essentiell ist sie jedoch nicht für dieses Genre.
    Es gibt gar nicht mal wenige erfolgreiche Strategie-Spiele, die keinen Multiplayer-Part haben, was allgemein akzeptiert wird.

    Nicht akzeptabel, weil sinnlos, wäre es jedoch bei MMORPGs.
    Diese leben, neben den bereits erwähnten RPG-Charakteristika, wenn auch zumeist in abgeschwächter Form, in erster Linie von den Zusammenspielmöglichkeiten der Spieler unter- und gegeneinander (PvE / PvP).
    Dafür sind Rätseleinlagen dort nicht erforderlich.

    Welche widerum bei Point & Click Adventures die Kernkomponente nebst einer guten Story und Kombinationsmöglichkeiten a la "Verwende [Schuh] mit [Fuß]" darstellen.
    Ob man in diesen über ein Waffenarsenal verfügt oder ob es actionreiche Kämpfe gibt, ist hingegen nicht entscheidend.

    Wohl aber bei Shootern, welche sich darüber hinaus auch durchs Leveldesign auszeichnen.
    Dafür würde man dort nicht erwarten irgendetwas aufzubauen oder komplexe wirtschaftliche Abläufe simuliert zu sehen.

    Also genau die Dinge, die Wirtschafts-Simulationen ausmachen.
    WiSims können aber gut ohne Kämpfe und ohne RPG-Elemente auskommen - auch ohne Story.

    Und so weiter.

    Natürlich gibt es jede Menge Hybride, also Spiele die sowohl in Genre A, als auch B gehören.
    Mass Effect ist z.B. ein Shooter mit RPG-Elementen - oder auch umgekehrt, je nachdem, wie man es betrachten mag.
    Daher ist die Story dort sehr viel entscheidender, als z.B. bei Dead Space.
    Und daher reagieren Spieler auch eher sensibel auf etwaige Schwächen bei selbiger, als sie es bei anderen, Nicht-Hybrid-Vertretern des Genres täten.
    Wenn es eine widersprüchliche Situation in S.T.A.L.K.E.R. gäbe, würde sich kaum jemand darüber aufregen. Selbige Schwächen bei einem Mass Effect - und die Foren wären voll von Beschwerden.
    Kein Wunder, da Mass Effect, wie gesagt, zur Hälfte ein RPG ist.

    Meine Frage ist nun:
    Warum werden die Spiele dann nicht auch genauso bewertet?

    Ich würde es grossartig finden, wenn ich einen kleinen Avatar hätte, Bürgermeister Yeagerle, der in meiner Stadt in Sim City rumläuft, einen Skillbaum hat und maßgeblich dazu beitragen würde, dass z.B. die Feuerwehr schneller vor Ort ist, weil ich ihn entsprechend geskillt hätte.
    Doch ist dieses typische RPG-Feature in einer WiSim wie Sim City ein reines Nice-to-Have, kein Muß.
    Ein Muß hingegen ist es, inwieweit und v.a. wie gut Sim City als zumindest annäherende Simulation funktioniert.
    Das muss ja auch gar nicht realistisch sein, sollte aber nachvollziehbar bleiben.
    Wenn sich die Leute beschweren, dass sie nix zu konsumieren hätten und ich ihnen ein Einkaufszentrum vor die Nase stelle, kann es nicht sein, dass sie sich dann beschweren, es gäbe zu wenig Konsum und dieser sei auch noch zu weit entfernt.
    Falls doch und falls dies kein Einzelfall ist hat Sim City in einer seiner Kerndisziplinen schlichtweg versagt.
    Da können die Häusschen noch so hübsch sein, die andere Seite der Waage hängt voll nach unten durch.

    Entsprechend sollte die Bewertung ausfallen, 80er- oder gar 90er-Bereich darf da nicht mehr drin sein.
    Denn andernfalls wäre es so, als ob ich als Mathe-Lehrer in der Schule zu einem Schüler sagen würde:

    "Zwar sind sämtliche deiner Ergebnisse falsch und auch der Rechenweg ist alles andere, als nachvollziehbar - aber ... ich mag deine Frisur: du bekommst eine Zwei Plus!"

    Schön für alle, die in Mathe schlecht waren (so wie ich) - aber unfair für alle anderen.
    Und unbrauchbar als Bewertung, von der WiSim-Interessierte ihre Kaufabsicht abhängig machen könnten.

    Wenn ich in einem Strategie-Spiel wie Rome 2 selbst im betrunkenen Zustand jederzeit die KI besiegen kann, weil sie hundert Jahre braucht, um zu begreifen, dass es für die Gesundheit ihrer Einheiten nicht förderlich ist sich von meiner Artillerie in Schutt und Asche schiessen zu lassen, dann hat das Spiel bei einer Kerndisziplin von Strategie-Spielen versagt.
    Da helfen auch keine hübschen Einheiten mehr.

    Es wäre etwas anderes, wenn man dies steuern könnte, falls man ein leichtes Spiel haben will.
    Doch dies geschieht nicht, wird eher schlecht als recht kompensiert mit Masse statt Klasse.

    Würde man Gewichtungen einführen, würde man definieren, dass Simulationen bei WiSims und KI bei Strategie-Spielen ausschlaggebender sind, als z.B. Grafik und Sound, dann wären auch die Bewertungen nachvollziehbarer und realistischer.

    A propos Grafik / Sound:

    Ich kann mich nicht erinnern jemals ein Spiel gekauft zu haben nur deswegen, weil es über eine tolle Grafik oder einen netten Sound verfügt hätte.

    Wenn ich ein Spiel spielen will, will ich - oh Wunder - ein Spiel spielen.
    Keine selbstablaufende Tech-Demo betrachten.

    Doch ich sehe es ein, dass es auch andere Menschen gibt, die das anders sehen.
    Ich verstehe es zwar nicht, akzeptiere es aber.
    Warum aber sollen diese handwerklichen Qualitätsmerkmale gleichwertig bewertet werden?

    Denn dies ist der Fall.
    Hier ein Beispiel:

    Grafik 10 / 10

    Sound 10 / 10

    Balance 10 / 10

    Atmosphäre 10 / 10

    Bedienung 10 / 10

    Umfang 10 / 10

    Startpositionen 10 / 10

    KI 1 / 10

    Einheiten 1 / 10

    Endlosspiel 1 / 10

    Gesamt 73 %



















    Hier hätten wir ein fiktives Strategiespiel.
    Mit wunderschöner Grafik, hervorragendem Sound, ausbalanciert, atmosphärisch und einer intuitiven Bedienbarkeit.
    Ausserdem fairen Startpostionen, die nie langweilig werden.

    So weit, so gut.
    Doch dann:

    Die KI bringt sich vorzugsweise selbst um, an Einheiten hätten wir stets dieselbe halbe Handvoll und das Endlosspiel ist genauso motivierend, wie ein Zahnarztbesuch bei akuter Wurzelentzündung.

    Und dafür dann 73% ?

    Das sind nur 5 Prozentpunkte (!) von der Wertung von FTL entfernt.
    (Übrigens: genau von jenem Spiel nahm ich auch die Kriterien, daher auch "Startpositionen".)

    Würde ich FTL nicht kennen, stünde ich beim Händler meiner Wahl vor dem Regal und hätte beide Games nebeneinander liegen, würde ich mir denken:

    "Naja, 78 und 73 - so groß ist der Unterschied nicht. Werden wohl vergleichbar sein."

    Nein, sind sie nicht.

    FTL macht Spaß - mein hypothetisches Spiel hingegen wäre eine einzige Gurke, da könnte ihr all die schöne Grafik nicht mehr helfen.
    Und das würde ich beim Spielen auch merken.
    Die 5 Prozentpunkte Differenz kämen mir schnell wie 50 vor.
    Nach einer Stunde Spielzeit hätte ich nur noch einen Wunsch:
    es zu deinstallieren.

    Nochmal zur Erinnerung:

    • 90+ Ein Hit, den selbst genrefremde Gamer spielen sollten!

    • 80-89 Für Fans des Genres ein Muss, aber auch für andere ein vielleicht interessanter Titel.

    • 70-79 Für Genre-Fans eine gute Wahl, alle anderen sollten sich das Spiel vor dem Kauf genau anschauen.

    • 60-69 Nur für Fans der jeweiligen Serie und selbst für die nicht unumschränkt zu empfehlen, alle anderen lassen die Finger davon.

    Zitiert aus buffed.de:
    http://tinyurl.com/lfbcbfd

    Ein Genre-Fan, in dem Falle also ein Fan von Strategiespielen, würde dieses 73er Game mit praktisch nicht vorhandener KI, mickriger Auswahl ebenso mickriger Einheiten und einem Endlosspiel aus der Hölle also als "gute Wahl" ansehen?
    Ich glaube nicht.

    Mein Plädoyer lautet also:

    Liebe GameStar,

    bitte fasst technisch orientierte Kritikpunkte (Grafik, Sound, Bedienung, Atmosphäre, Balance) zusammen.
    Sie sind Handwerk, entscheiden nur zu einem gewissen, untergeordneten Teil über den Spaß, den man mit einem Game hat.

    Wertet dafür jedoch die Kern-Teile des jeweiligen Genres deutlich höher, gewichtet diese, doppelt, dreifach oder wie ihr es für richtig haltet.
    Macht zur Not eine Umfrage hier.

    Relativierungen:

    Über Atmosphäre liesse sich hierbei noch streiten.
    Ich erwarte eine angemessene Atmosphäre eigentlich in jedem Spiel, sehe sie daher als handwerkliches Qualitätsmerkmal an.

    Zweifelhaft ist heutzutage die Notwendigkeit eines separaten Punktes namens "Sound":
    ein übrig gebliebenes Relikt aus den Anfängen der Computer-Spiele-Ära, als dieser noch keine Selbstverständlichkeit darstellte.
    Heute ist es absoluter Standard, jeder PC von der Stange hat einen Sound-Chip, nahezu jedes Spiel kommt mit Sound daher.
    Ausserdem läuft man Gefahr des "Doppel-Gemoppelten", da sich Sound fast ausnahmslos auf einen bereits vorhandenen Kritikpunkt, nämlich besagte Atmosphäre auswirkt.
    Ausgenommen bei Spielen, bei denen er eine Schlüssel-Rolle spielt, wie etwa Guitar Hero.
    Nur wäre es kein Problem, Sound dann bei der Beurteilung solcher Spiele als Kern-Disziplin aufzuführen.

    Bei näherer Betrachtung fällt auch Grafik eigentlich unter den Punkt Atmosphäre.
    FTL z.B. hat eine sehr minimalistische Grafik, die ihr abgewertet habt.
    Doch sie war so gewollt und kam beim spielenden Publikum auch an, immerhin lebt FTL von seinem Rogue-like-Retro-Charme, erfüllt also auch mit Hilfe seiner Grafik die Atmosphäre, die es erfüllen wollte und sollte.
    Doch wie gesagt, ich akzeptiere es, ohne deren Ansicht zu teilen, dass es Grafik-Fetischisten gibt (das ist nicht abfällig gemeint), was den Fortbestand als eigenständigen Punkt von "Grafik" zumindest für mich legitimiert.

    Die Bedienung sollte in negativen Extremfällen ein Stand-Alone KO-Kriterium darstellen, da man selbst ein noch so gutes Spiel, welches sich aber nicht bedienen lässt, schlicht und ergreifend nicht spielen kann.
    Dasselbe muß natürlich für Bug-verseuchte Spiele gelten, die sogar Plot-Stopper besitzen.
    In solchen technischen Fail-Cases würde es sich anbieten bis zur Behebung der gröbsten Missstände ganz auf jede Wertung zu verzichten.
    Wie ihr es schon so manches Mal zurecht gemacht habt.

    Gewichtungen sind jedoch wichtig, sie erzeugen ein ganz anderes, meiner Meinung nach sehr viel realistischeres Bild.

    Übertragen auf mein hypothethisches Spiel hiesse es nämlich:

    Handwerk: Gewichtung 50 %
    Kern-Disziplinen: Gewichtung 150 %

    Also:

    Handwerk = Grafik + Sound + Bedienung + Atmosphäre + Balance
    10 + 10 + 10 + 10 + 10 = 50
    Gewichtet: 50 * 50/100 = 25

    Kern-Disziplinen = Umfang + Startpositionen + KI + Einheiten + Endlossspiel
    10 + 10 + 1 + 1 + 1 = 23
    Gewichtet: 23 * 150/100 = 34,5 ~ 35

    Ergebnis:
    25 + 35 = 60

    60 % - nicht 73 %.

    FTL käme demnach auf 81%.
    Der Unterschied wären nicht mehr 5, sondern über 20 Prozentpunkte!
    Das sieht schon ganz anders aus.

    Ja, genau das würde ich einem solchen Spiel geben, das über elementare Schwächen in seinen Kern-Disziplinen verfügt.
    Ich könnte es niemandem ernsthaft empfehlen, da könnte die Grafik auch photorealistisch sein.

    Wenn ich mich nicht verrechnet habe, müsste also ein Spiel, das sowohl in handwerklicher, als auch in spielerischer Hinsicht als "superb" zu bezeichnen wäre, genau auf 100 % kommen:
    25 + 75 = 100
    Auch, wenn das nach wie vor ein fiktiver Fall bleiben dürfte, da man sich fragen darf, was 100 % bei einem Spiel bedeuten würde.

    Nochmal:

    Das war nur ein Vorschlag.

    Die Gewichtungen könnten auch ganz anders ausfallen.
    Nur DASS Gewichtungen eingeführt werden - Genre-abhängig - dafür bin ich auf jeden Fall.

    Ich freue mich über Feedback - gern auch von der Redaktion.

    PS: Sollte ich mich bei irgendwas verrechnet haben, schreibt's bitte in den Kommentar rein.
    Wie gesagt, ich war nicht gerade der Beste in Mathe.

    Leider konnte meine Frisur auch nicht überzeugen ;-)

    Über den Autor

    Yeager
    Chuck Yeager durchbrach als erster Mensch die Schallmauer.
    <br/>Ich stolperte über seinen Namen als damals noch kleiner Junge beim Gucken von "Der Stoff aus dem die Helden sind".
    <br/>Sein Name gefiel mir, wurde zum Nick und blieb es.

Kommentare

Um einen Kommentar zu schreiben, melde dich einfach an und werde Mitglied!
  1. Musikus
    Yeager,

    das ist mir Abstand die beste, nachvollziehbarste und am leichtesten umsetzbare Idee, die ich jemals zum Thema "Wertungssystem der Gamestar" gelesen habe. Bravo!
    (Hab mich in den letzten Jahren hier ziemlich ausgeklinkt, aber früher viel mitdiskutiert bei dem Thema.)

    Ich geb zu - ich hab mittlerweile mich mit der Entstehung der Wertungszahl abgefunden, da ich einsehe, dass fast alle so ne blöde Zahl wollen und sie halt irgendwie zustande kommen muss, es gleichzeitig aber "das perfekte System" nicht gibt. Aber alles, was Du schreibst, wären tatsächlich sinnvolle Verbesserungen.
      5 Person(en) gefällt das.
  2. Takamisakari
    Es baut quasi darauf auf. ;)

    Wichtiger als die Details wäre überhaupt mal die Bereitschaft seitens GameStar, etwas ändern zu wollen. Eine diesbezüglich offene Diskussion wäre dann der geignetere Ort für die Details. Bis dahin kann man sich die Arbeit eigentlich sparen.
      3 Person(en) gefällt das.
  3. Yeager
    Ist das nun eine Zustimmung oder eine Ablehnung?
    Ich interpretiere es als Zustimmung, da dein modifiziertes Multiplikations-Konzept v.a. eine wichtige Gemeinsamkeit mit meinem Vorschlag aufweist:

    die Kritik an der bisherigen, eindimensionalen Lösung.

    Wegen den Details:
    Ich sagte ja, es ist nur ein Vorschlag.
    Wenn andere Konzepte besser sind, als meins: immer her damit!
      4 Person(en) gefällt das.
  4. Takamisakari
    Das Thema Gewichtung war bei ähnlichen Blogs auch immer wieder ein Aspekt, der spätestens in den Kommentaren mehrfach wiederzufinden war.

    Sinnvoller für die Gewichtung ist es, wenn man einfach Anteile auf die Aspekte verteilt. Das können Prozentwerte sein, die in der Summe 100 ergeben, müssen es aber nicht, denn die Summe steht stellvertretend für 100 %.
    Wer bspw. bei Grafik eine 4 und bei Sound eine 2 als Gewichtung ansetzt, der sagt damit aus, dass ihm Grafik doppelt so wichtig ist. Nach obigem Prinzip würde man das durch 150 % und 75 % ausdrücken, doch wenn man eine andere Grundlage ansetzt, würde man anfangen, die anderen Werte mühsam anzupassen.

    Ich hatte auch mal erwähnt, dass jeder User sich seine Gewichtung für bestimmte Genres zusammenstellen kann. Wird ein Spiel getestet, so kann von allen Usern eine durchschnittliche Gewichtung herangezogen werden, um eine (dynamische) mittlere Bewertung darstellen zu können (statt der bislang festen Wertung).

    Was aber gerne vergessen wird, und das ist auch die Absicht von fridalein mit dem Kardinalfehler, dass gewisse Features Voraussetzung für andere Features sind.
    Bei einem Rennspiel bspw. ist Fahrphysik/Handling ein Kern-Feature. Ist diese totaler Murks, so spielt es keine Rolle, wie gut Grafik, Sound, Karriere-Modus, Multiplayer-Modi etc. sind.
    Statt Addition von Feature-Punkten müsste es eher auf eine Multiplikation hinauslaufen (entsprechende Werte vorausgesetzt).
    So werden dann auch bspw. Grafik-Blender entlarvt.
      2 Person(en) gefällt das.
  5. Gra
    Ja genauso sehe ich das auch, Grafikblender und der gleichen schaffen es immer wieder Topbewertungen zu erreichen.
    Was zwingend in die Bewertung einfliesen müsste ist Perfomance, es kann nicht sein das ein Deus Ex: The Fall irgendwie sehr schlecht aussieht und irgendwie sowas wie eine KI verfügt aber weitaus mehr Leistung bezieht als Deus Ex: Human Revolution.
    Ebenfalls ein solches Beispiel war das erste Crysis, es sah genial aus und die OpenWorld Komponente war genial aber es hatte einen ineffeizienten Code der sehr viel Leistung verbratten hat eigentlich wie der Netcode von BF4.
    Das muss ebenfalls geprüft werden und in die Bewertung einfliesen.

    Ich schliesse mich dem Plädoyer von Yeager an, setzt Gewichtungen ein und macht eine Feinteilung, so sollte Grafik etwas mehr Aufgespalten werden z.B. Lichtstimmung, Texturen, Schatten, Grafikphysik und und und.
      2 Person(en) gefällt das.
  6. Bakefish
    Sehr, sehr interessanter Blog.
    Ja, das Wertungssystem der GS ist mir hin und wieder etwas suspekt- angenommen, man hätte einen spieltechnischen Meilenstein, der dummerweise nur eine Grafik der alleruntersten Sorte bietet und ziemlich kurz ist.
    Endeffekt? 82 Punkte. Meh. Ist schon kein Meilenstein mehr. Dieser Wertung nach zu urteilen.
    Daher finde ich das Lesersystem, dass man selbst einfach eine Punktezahl vergibt und unterschiedliche PFaktoren, positive als auch negative, unterschiedlich stark wertet. Beim einen Spiel regt die dämliche KI halt weniger auf als beim anderen. Hier wird mehr auf Atmosphäre gesetzt, da weniger.
    Oder man macht es wie bei Filmen. Zählt positive und negative Aspekte auf und belässt es dann aber auch, es gibt dann keine Wertung in Punkten, Prozent oder anderen Einheiten, es heißt halt "für Genre-Fans", "Spitzenspiel für alle" oder halt irgendetwas in die Richtung.
    Ist halt Ansichtssache. Dass Grafik und Sound nicht so sehr gewichtet werden sollten, finde ich aber auch :-)
    Jedenfalls... dein Blog war sehr schön zu lesen, grüner Daumen^^
      3 Person(en) gefällt das.
  7. fridalein
    Schön, dass du einen konkreten Vorschlag anhand eines konkreten Beispiels ins Spiel bringst.

    Ich würde sogar noch 2 Schritte weiter gehen:

    1. In meinem Wertungssystem gäbe es in jeder Kategorie einen "Kardinalfehler"-Punkt.
    Das bedeutet: Wenn ein Aspekt, der für das Spiel(genre) elementar ist, untererfüllt ist, würde hier eine Oberkategorie entsprechend genullt --> Bsp.: Sound: Musik ist super, Vertonung der Zwischensequenzen ist exzellent, jedoch ist der Sound der Einheiten quietschig in einem unerträglichen Fregquenzbereich: dann gäbe es in meinem sehr platten Beispiel (bitte daran nicht inhaltlich hochziehen) bei Sound eben nicht 7/10, sondern 0/10. Damit meine ich nicht, dass immer wenn ein Negativpunkt auftaucht, genullt wird, sondern wirklich nur bei elementaren Fails.


    2. Analog zum Wahlomat sollte der interessierte Leser hier seinen Fokus bei den Kategorien selbst setzen können.
    Das bedeutet: Aspekte, die dem User wichtig sind, werden hier eben noch mal extra gewichtet, andere Dinge dagegen bspw. nicht gewertet - so könnte jeder User die Wertung des Games bestimmen, die genau für ihn wichtig und richtig ist.
      4 Person(en) gefällt das.
Top