User Tag List

Ergebnis 1 bis 3 von 3
  1. #1
    Mitglied Avatar von Cap'n Kuda
    Registriert seit
    11.2018
    Beiträge
    848
    Mentioned
    14 Post(s)
    Tagged
    0 Thread(s)

    Theoretisches zu Panini Sammelalben

    Da ich die folgenden Informationen interessant genug finde, habe ich mir die Freiheit genommen, hierfür ein eigenes Thema zu erstellen (bisher sind die Informationen nur versteckt in irgendwelchen Beiträgen).

    Ich hatte mir nämlich vor kurzem auch die "85 Jahre Donald Duck Sammelkollektion" und zwei zugehörige Displays (je 50 Päckchen á 5 Stickern) gegönnt und bei dieser Gelegenheit den Spaß gemacht, die theoretischen Überlegungen zu den Wahrscheinlichkeiten weiter zu verallgemeinern und die Päckchen auf Gleichverteilung zu testen. Hier folgt nun meine Auswertung.

    Rohdaten der 2 Displays


    Code:
    Sticker Display 1
    103 89 191 127 91
    260 247 121 150 218
    132 146 102 222 45
    78 180 271 20 270
    174 61 160 176 255
    261 228 106 131 14
    50 57 272 21 122
    33 268 154 4 129
    99 187 74 147 30
    197 205 95 70 223
    42 194 112 269 5
    275 64 68 226 163
    137 158 45 138 8
    49 196 29 136 259
    17 237 241 214 124
    108 165 39 156 114
    242 236 254 2 200
    69 46 122 87 253
    235 188 32 209 233
    88 116 179 67 56
    219 3 178 232 172
    139 83 5 135 96
    212 145 7 182 211
    173 59 125 243 183
    79 37 114 82 22
    9 6 252 44 195
    150 184 144 168 58
    263 215 218 11 71
    75 113 56 189 271
    111 34 222 1 101
    131 157 80 234 143
    267 12 14 251 191
    65 115 183 146 68
    248 273 21 192 98
    70 40 90 216 81
    204 15 223 247 160
    140 177 58 57 254
    225 244 269 161 270
    136 35 27 13 92
    54 258 259 228 74
    148 133 143 194 178
    202 220 67 110 33
    209 84 77 231 79
    238 229 233 205 45
    164 142 81 165 241
    208 19 243 55 275
    182 38 128 257 75
    213 206 211 121 122
    119 86 92 116 218
    181 264 168 185 242
    
    Sticker Display 2
    79 198 172 192 201
    263 20 253 16 76
    111 273 29 35 52
    44 157 126 4 134
    248 244 32 84 250
    1 40 63 226 26
    139 152 200 1 98
    17 221 8 217 162
    65 127 71 110 275
    192 35 190 72 2
    193 268 96 260 41
    202 19 252 94 20
    267 166 22 261 109
    208 264 222 89 268
    161 84 159 232 170
    213 237 254 212 137
    75 167 124 161 33
    225 220 7 38 221
    132 147 39 228 61
    54 236 174 49 154
    185 219 160 187 148
    141 235 68 3 238
    167 251 272 89 185
    43 4 269 104 64
    2 3 87 67 23
    127 247 112 176 149
    138 236 156 226 175
    164 158 74 149 17
    198 11 102 94 55
    152 214 47 38 110
    166 176 21 180 181
    267 50 5 83 186
    139 262 241 12 24
    50 138 179 205 187
    274 232 243 135 237
    119 36 45 51 263
    140 61 191 55 242
    91 197 271 64 204
    10 215 178 9 69
    60 46 122 132 193
    88 82 80 145 83
    217 11 234 189 12
    240 214 168 82 215
    42 87 66 196 158
    249 15 218 248 79
    155 37 114 42 204
    108 135 144 188 46
    16 18 216 146 15
    227 258 14 225 75
    48 113 56 108 54
    
    Karten Display 1
    16
    22
    12
    31
    29
    3
    22
    8
    7
    16
    24
    3
    20
    29
    21
    16
    34
    33
    7
    29
    11
    10
    28
    7
    26
    6
    20
    2
    36
    19
    33
    15
    13
    32
    10
    28
    23
    9
    26
    6
    4
    25
    36
    19
    17
    35
    13
    32
    30
    12
    
    Karten Display 2
    25
    18
    18
    9
    5
    32
    35
    31
    5
    19
    9
    6
    27
    20
    1
    27
    14
    32
    33
    15
    1
    6
    17
    21
    23
    2
    4
    28
    14
    19
    15
    21
    29
    13
    11
    28
    30
    33
    24
    3
    34
    10
    8
    26
    11
    36
    34
    16
    7
    2



    Auswertung der 2 Displays


    Code:
    "[,q]" steht für die Anzahl verschiedener Motive, die mindestens q-fach vorkommen.
    
    Karten Display 1
    [,1] [,2] [,3] [,4] [,5] [,6]
     31   16    3    0    0    0
    
    Karten Display 2
    [,1] [,2] [,3] [,4] [,5] [,6]
     34   16    0    0    0    0
    
    Karten: theoretisch vorhergesagte Erwartungswerte bei Gleichverteilung aller möglichen Päckchen
     [,1]   [,2]  [,3]  [,4]   [,5]   [,6]
    27.19  14.62  5.82  1.79   0.44   0.09
    
    Sticker Display 1
    [,1] [,2] [,3] [,4] [,5] [,6]
    196   51    3    0    0    0
    
    Sticker Display 2
    [,1] [,2] [,3] [,4] [,5] [,6]
    190   60    0    0    0    0
    
    Sticker: theoretisch vorhergesagte Erwartungswerte bei Gleichverteilung aller möglichen Päckchen
      [,1]    [,2]   [,3]   [,4]  [,5]   [,6]     
    165.35   63.28  17.15   3.53  0.57  0.078


    Man mag nun denken, die Differenz bei Display 2 zur theoretischen Vorhersage 190-165.35=24.65 lässt ich auch bei Annahme einer Gleichverteilung aller Päckchen noch mit dem Zufall erklären. Dem ist aber ganz eindeutig nicht so. Um dies rechnerisch zu verdeutlichen, sei mit Y die Anzahl verschiedener Motive, welche man mit einem Display bekommt, bezeichnet (d.h. die Motive, die mindestens einmal vorkommen => q=1). Unter der Annahme der Gleichverteilung der Päckchen ist die Wahrscheinlichkeit, dass Y vom Erwartungswert ?=165.35 um weniger als 24.65 abweicht, gleich

    P(|y-?|<24.65)=P(140.7<Y<190)=P(140<Y<190)=0.9999989

    Die Wahrscheinlichkeit, dass sogar beide Displays Abweichungen vom Erwartungswert um 24.65 oder mehr haben (wie es bei mir ja mit 190 und 196 der Fall war), beträgt, unter der Annahme der Gleichverteilung der Päckchen, (1-0.9999989)^2, also etwa 1 zu 826 Milliarden (unter Annahme der Gleichverteilung, sind die Displays natürlich unabhängig)! Zum Vergleich: Die Chance auf den Lottohauptgewinn (6 Richtige aus 49 + Superzahl) beträgt rund 1 zu 140 Millionen. Die Päckchen innerhalb eines Displays bei Panini sind damit ganz klar nicht gleichverteilt! Das bedeutet, es kommen gar nicht alle möglichen Päckchen in den Displays vor oder sie kommen mit unterschiedlichen Häufigkeiten vor oder beides.

    Ob die Päckchen im Gesamten trotzdem noch gleichverteilt sind, lässt sich mit den mir vorliegenden Daten nicht beweisen oder widerlegen. Da bräuchte man Päckchen aus vielen (>20) verschiedenen Displays. Aber ich habe nur zwei Displays. Falls sich in Zukunft jemand noch Sticker Päckchen dieser Serie kauft (oder auch anderer Serien), würde ich mich freuen, wenn die Daten hier in diesem Thema veröffentlicht werden.

    Erwartungswert bei unbekannter Verteilung

    Nun da die Verteilungsannahme (jedes der (276 über 5) = 12868936080 möglichen Päckchen aus 5 Stickern kommt mit gleicher Wahrscheinlichkeit vor) auf sehr wackligen Füßen steht, lassen sich natürlich auch die Formeln für den Erwartungswert und die Varianz der erhaltenen Motive (beim Kauf von n Päckchen) möglicherweise gar nicht auf das Panini-Modell anwenden. Welche Informationen über die "wahre" Verteilung der Sticker bzw. Päckchen sind überhaupt sicher? Dies sind offenbar genau die beiden folgenden Annahmen.

    (A1) Alle Päckchen enthalten genau s>0 verschiedene Sticker (bei Panini in der Regel mit s=5 erfüllt).
    (A2) Die Wahrscheinlichkeit bei zufälliger Wahl eines Päckchens ein bestimmtes Stickermotiv zu erhalten, ist für jedes Motiv gleich.

    Annahme (A1) ist offensichtlich korrekt. Annahme (A2) wird durch Hermann Paul, Geschäftsführer von Panini, garantiert: "Alle Panini-Sticker werden gleich oft gedruckt"
    https://www.kleinezeitung.at/sport/f...h-oft-gedruckt

    Lässt sich alleine aus diesen beiden Annahmen, ohne der genauen Kenntnis, welche Päckchen mit welcher Häufigkeit vorkommen (oder auch gar nicht vorkommen), trotzdem noch der Erwartungswert der Anzahl der beim Kauf von n zufällig gewählten Päckchen erhaltenen unterschiedlichen Stickermotive, die mindestens q-fach vorkommen (q=1,2,3,...) bestimmen? Mich hat es etwas überrascht, aber die Antwort auf diese Frage ist tatsächlich "Ja" und die Formel zur Berechnung ist die gleiche wie im Modell der Gleichverteilung aller Päckchen!

    Gibt es insgesamt m verschiedene Stickermotive und bin ich an k>0 von diesen interessiert, dann ist, unter den beiden Annahmen (A1) und (A2), die erwartete Anzahl mich interessierender, verschiedener Motive, die mindestens q-fach vorkommen, beim Kauf von n zufällig gewählten Päckchen, die jeweils s verschiedene Sticker enthalten, durch


    https://s1.imagebanana.com/file/200202/0mUmxvIG.png

    gegeben, unabhängig davon, wie die Wahrscheinlichkeitsverteilung genau aussieht und welche Päckchen überhaupt vorkommen! Zur Berechnung der Varianz reichen die Informationen (A1) und (A2) leider nicht aus.

    Herleitungen finden sich im Skript im Abschnitt "Anzahl mindestens q-fach vorkommender Objekttypen – die Panini-Formel" (S. 3 - 4). Das Skript ist mittlerweile zu einer wirklich umfangreichen Arbeit, mit tatsächlich neuen Ergebnissen über gewisse Zufallsvariablen, angewachsen und ich bin am überlegen, diese in einem anderen Rahmen zu veröffentlichen. Solange ich das nicht tue, kann sich jeder gerne eine aktuelle Version über die folgenden beiden Links beschaffen bzw. online lesen.

    Download Link (MEGA)

    online lesen (YUMPU)

    Die Auswertungen der beiden Displays führen also zu der Vermutung, dass die Produktionsprozesse bei Panini dazu führen, dass die Auswahl der Päckchen innerhalb eines Displays nicht zufällig geschieht, wohlgemerkt unter der Gültigkeit der (globalen) Annahmen (A1) und (A2).

    R-Skript
    Code:
    n = 42; m = 276; k = 276; s = 5; q = 1; p = s / m
    e = k - k * pbinom(q-1, size=n, prob=p)
    print(e)
    Geändert von Cap'n Kuda (23.02.2021 um 00:56 Uhr) Grund: Link aktualisiert

  2. #2
    Mitglied Avatar von TiTriTra
    Registriert seit
    02.2006
    Beiträge
    204
    Mentioned
    0 Post(s)
    Tagged
    0 Thread(s)
    Zitat Zitat von Cap'n Kuda Beitrag anzeigen
    Die Auswertungen der beiden Displays führen also zu der Vermutung, dass die Produktionsprozesse bei Panini dazu führen, dass die Auswahl der Päckchen innerhalb eines Displays nicht zufällig geschieht,
    Definiere "zufällig"! ;-)
    Du gehst bei deiner Wahrscheinlichkeitsrechnung ja immer von einem idealisierten Zufall aus, den es im mechanischen Produktionsprozess so aber wahrscheinlich gar nicht gibt.
    Die Motive werden sicher nicht zufällig gedruckt, sondern jedes einzelne Motiv bogenweise. Die Motive werden dann irgendwie gemischt und schon hier wird wohl nicht mehr auf mathematische Genauigkeit (größtmögliche Entropie) geachtet. Es reicht, wenn die Motive "durcheinander" sind. An einer Stelle liegen dann etwas mehr vom Motiv X, an anderer Stelle von Motiv Y. Man prüft nur noch, dass 5 verschiedene in einer Tüte sind und gut ist.
    Eine exakte Zufälligkeit würde man nur erreichen, wenn ein Algorithmus fünf Zufallswerte ermitteln würde und die Tüte dann mit den entsprechend ausgelosten Motiven befüllt würden. Aber was wäre das für ein Aufwand! Außerdem wären dann am Ende von Motiv X ein paar zu wenig und von Motiv Y ein paar zu viel gedruckt.

    Wahrscheinlich wurden von allen Motiven gleichviele gedruckt, aber die Verteilung auf die Tütchen ist nicht zufällig sondern nur "hinreichend durcheinander".
    Das ist meine Vorstellung; meine letzte Mathestunde ist allerdings schon ein paar Jahre her ...

  3. #3
    Mitglied Avatar von Cap'n Kuda
    Registriert seit
    11.2018
    Beiträge
    848
    Mentioned
    14 Post(s)
    Tagged
    0 Thread(s)
    Zitat Zitat von TiTriTra Beitrag anzeigen
    Wahrscheinlich wurden von allen Motiven gleichviele gedruckt, aber die Verteilung auf die Tütchen ist nicht zufällig sondern nur "hinreichend durcheinander".
    Ich denke das trifft für die Displays zu. Aber wenn man nur unregelmäßig in dem einen oder anderen Laden ein paar Päckchen kauft und diese demzufolge aus unterschiedlichen und unabhängigen Displays stammen, sollte Annahme (A2) gelten (und die beruht ja auch nur auf der unbewiesenen Behauptung von Herrn Paul). Vielleicht geht Panini ja irgendwann dahin über, dass die Bögen schon zufällig zusammengestellt sind (also vor dem Zerteilen). Dann bräuchte man auch nicht mehr kompliziert mechanisch mischen.
    Ursprünglich wurden die Bilder übrigens ähnlich den Lottozahlen in einem Butterfass gemischt. Da hatte man wohl echten Zufall.
    https://panininewsroom.de/es-begann-mit-wundertueten-2/

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •