37
  • mrzed001
    #37
    Még mindig nem érted :(
    Az a felháborító, hogy pontos számszerűsíteni próbálják a hasraszámaikat.
    Ha csak annyit írnának, hogy nézettsége ~600.000, akkor (sem annyira, de) ok, viszont az, hogy 554.213 és 641.323 az a pofátlanság a köbön (mindkettő helyett a ~600.000 kevésbé lenne dühítő, mert a kettő közötti majd 100.000 BŐVEN a saját hibahatárukon belül van, sőt talán a 200.000-es csoportosítás lenne sztem a legkisebb, amit engednék -bár komoly fenntartásokkal azt is-).
    Éppen a te példádból látszik a legjobban, nézd az utolsó oszlopot!
    Első esetben "durván" kikapott az ut.előttitől, meg a negyediktől, aztán a végén meg már vezet előtte (ahogy pontosodik a mérés). És ahogy említettem ez TILOS felszorozni, és a teljes lakosságra vetíteni, mert csak egy szűk célcsoportot vizsgáltál

    ahogy írtam, ha egy tendencia elindul, akkor azt nem nagyon állítják meg
    valami komoly statisztikai ismeretbeli problémád van. Az NEM a tendencia, hogy a nagyobb mérésszám felé valaminek hogy módosul az aránya, az a tendencia, hogy a következő méréseknél hogy módosul az arányuk

    most lehet elemezni, hogy egy totál random minta 1%-a mennyire ad jó képet a sokaságról
    És itt jön a következő probléma, NEM random a minta, csoportokon belül random (életkor, képzettség, ...) talán(sic!), és NEM egyenletes eloszlású (azaz pl x*5000 lakosú város x mérő)!
  • winnie
    #36
    Mert ha hibás is a mérés, akkor minden tévéadót érint, azaz mivel minden tévéadó ugyanazokat az eredményeket kapja, és ugyanugy azon van, hogy olyan musorokat adjn, ami nagyobb nézettséget produkáljon ezen a mérésen, a verseny maga nem torzul.

    próbűálom én mondani ezt, de itt az a gond, hogy a szeretett sorozatokat mindig alulbecslik, amit utálnak azt meg felül. ez már alapból abszurdum:)

    220 szavazatnál: 13 - 5 - 44 - 12 - 6 - 11 - 9
    1132szavazatnál: 14 - 5 - 44 - 10 - 5 - 11 - 11
    2440szavazatnál: 16 - 4 - 41 - 10 - 6 - 11 - 13
    5281szavazatnál: 19 - 4 - 39 - 9 - 6 - 11 - 12

    ahogy írtam, ha egy tendencia elindul, akkor azt nem nagyon állítják meg. "úgy lenne a logikus, ha az első és/vagy az utolsó növekedésnek indult oszlop tovább nőne a harmadik kárára, " - most lehet elemezni, hogy egy totál random minta 1%-a mennyire ad jó képet a sokaságról. (és, ha egy ilyen random minta milyen jó közelítés - látszik az is, hogy mik és mekkorák az eltérések, mint ahogy a feldolgozás során látszik az is, hogy az eloszlás változása nagyjából egyenletes. ezt kell elképzelni mondjuk más csoportokra. (nem így működik, de a 18-49-es diplomásokra, mondjuk)
  • mrzed001
    #35
    Én csak egy statisztikát mondok, ami lényegében értelmetlenné teszi az egész nézettségi (hasra)statisztika mérést:
    Sorozatrészek letöltési statisztikája - max letöltésszám / rész
    2003 I. félév: 23.000 (vagy 2002 év vége ? öregszem)
    2003 II. félév: 42.000
    2004: 67.000
    2005: 140.000

    Most becsülök egyet (és nagyon szerény leszek):
    2006: 270.000
    2007: 480.000
    2008: 820.000
    2009: 1.500.000
    2010: 2.900.000

    Szóval 5 éven belül sztem annyira online lesznek a sorozatok, hogy már inkább ezeket a pontos statisztikákat kezdik el figyelni
  • Cat #34
    egy nagyon fontos dologról megfeledkeztek: ennek az egész vitának nincs értelme. Ok. szerintetek nem jó a mérés, winne szerint igen. Én meg azt mondom, hogy _nincs értelme_ ezen vitatkozni, mert lényegtelen. Hogy miért? Mert ha hibás is a mérés, akkor minden tévéadót érint, azaz mivel minden tévéadó ugyanazokat az eredményeket kapja, és ugyanugy azon van, hogy olyan musorokat adjn, ami nagyobb nézettséget produkáljon ezen a mérésen, a verseny maga nem torzul.

    Az már egy egészen más kérdés, hogy ez milyen müsorokat eredményez, de a vitátok ezt a témakört nem érinti.
  • mrzed001
    #33
    tipikus belemagyarázás - kár érte... sosem mondtam, hogy pontosak, mindössze (ideírhatom, hogy nagy valószínűséggel) hibahatáron mozgó becslések.
    A hibahatárok mértékében nem értünk egyet. Te azt mondod, hogy ezzel a 850-es mért adattal 5%p-os szórás érhető el. Én azt mondom, hogy ezzel 30-50%p-os szórás érhető el (+- ~ félmillió ember)
  • mrzed001
    #32
    alapvetően az a gáz a vitában, hogy én már a sokadik példával alatámasztott érvet hozom fel és, ami ellen nem tudsz semmit felhozni, azt otthagyod és elfelejted. azt hiszem ideje, hogy te hozz érveket, én bőven hoztam.
    Az a gáz, hogy nem tudsz a választásokon kívül olyan példát mondani, AHOL TÉNYLEGESEN meg lettek számolva az emberek szavazatai, így ténylegesen össze lehet vetni a közvéleménykutatós előrejelzésekkel.
    Ez az egy valós megszámolt adat viszont engem támaszt alá 1 milliószor :p

    és persze sokadjára megkérdezem, hogy miért nem mersz egy lyen szavazást kiíratni? (szerintem az én igazamat bizonyítaná)
    Csak akkor lenne értelme, ha népszavazás lenne ugyebár
  • mrzed001
    #31
    a 15%-nak a 15%-a egy kis sokaságot fed le. egy másik sokaságot másik 15%-nak a 15%-val tudsz lefedni, hogy ilyen földhözragadt példákat hozzak.
    Akkor te még mindig nem érted, hogy 15%-nak a 15%-ának a 15%-ának a 15%-a amiről szó van. Nem kettő, 4 lépés!

    akkor ebben egyetértünk. ha a népességet felosztod több részre és a kiválasztott népcsoportokat le tudod fedni mintákkal, akkor a kiválasztott népcsoportok szokásait tudod modellezni a minták szokásaival. innen már csak egy lépés, hogy a hazai statisztikák alapján a kis csoport súlyozása segítségével reprezentáld a népességet.
    Még mindig nem érted, hogy a népesség szokása =/= egyes népcsoportok szokásával (amiket ráadásul komolyan befolyásolnak random tényezők)
  • mrzed001
    #30
    azt a kliens vagy a megrendelő határozza meg. általában 5% (+/- 2,5%). ez 1,5M-ós nézettsgnél kiszámolhatod hogy mennyi
    Na itt kezdődik a gond. Nincs még olyan, hogy 1,5M-ós nézettség, van egy sorozat, tudni akarod mennyien nézik. Kiindulás a teljes népesség 10M (ezt lehet szűkíteni statisztikai alapon, de csak minimálisan). Az 5%p szórás eléréséhez pedig igencsak nyújtózniuk kellene, ahhoz a 1/10000 édes kevés
  • winnie
    #29
    Itt valami olyasmit mondasz, hogy adott egy 10M alapcsoport, és ennek 1M fős mintacsoportja, mondjuk 1% becslési eltéréssel.

    a példa csak arra volt jó, hogy mr. zed-nek levezessek egy gondolkodásmódot, mert egyébként nem értette, hogy mire gondolok. így jobban érthetőnek tűnt, hogy mire gondolok.

    Mert nekem van matek diplomám, szóval ne akarj a statisztika áltudományával

    én nem a diplomámmal szoktam érvelni, sry. ha te azt mondod, hogy áltudomány, akkor kénytelen vagyok neked - matematikai statisztika sem létezik?

    tegnapig az sem tudtam, hogy van kumulált szorzás (ha te mondod), csak próbáltam képszerűen magyarázni, hogy milyen lehet ez a statisztika. nem vagyok statisztikus, de nyilván hasonló az alapja. (ha csak matek lenne a számítás, akkor mateknak neveznék, de biztos szerepet játszik a felmérésekben a szórás, átlagos abszolút eltérés, fogalmam sincs). nem én számolom.

    dettó nem tudom hogy történik a mintavétel, csak céloztam rá, hogy egy bizonyos jellemzőkkel megáldott népcsoport szokásai leírhatóak kis hibaszázalékkal minimális minta alapján.

    de mondom, konkrét példát. hány százalékot kell vizsgálni? és hogy számítódik a kumulálódó hiba lehetősége. ezt leírhatod.
  • winnie
    #28
    Magyarán néha jók a saccok, néha rosszak a saccok, de azért te azt mondod, hogy kezeljük őket pontos számadatként???

    tipikus belemagyarázás - kár érte... sosem mondtam, hogy pontosak, mindössze (ideírhatom, hogy nagy valószínűséggel) hibahatáron mozgó becslések.
  • winnie
    #27
    LOL. Ennek a 850 családnak a tendenciája olvasható ki az adatokból

    félreérted - olvasd el pontosan, hogy mit írok, mert felesleges kétszer ugyanazt leírnom. a családok által reprzentált sokaság szokásainak a tendenciája olvasható ki. ez az alap.

    te is elismerted, hogy a 16-35 éves netes B-sek szokásainak megállapításához elég 1%-uk (random) szokásainak vizsgálata. analogizálj.

    alapvetően az a gáz a vitában, hogy én már a sokadik példával alatámasztott érvet hozom fel és, ami ellen nem tudsz semmit felhozni, azt otthagyod és elfelejted. azt hiszem ideje, hogy te hozz érveket, én bőven hoztam.

    és persze sokadjára megkérdezem, hogy miért nem mersz egy lyen szavazást kiíratni? (szerintem az én igazamat bizonyítaná)
  • winnie
    #26
    x%-éka szóval már szerinted sem fedi le a teljes mintát. Hát éppen erről beszélünk, ezt próbáljuk megértetni veled.

    a 15%-nak a 15%-a egy kis sokaságot fed le. egy másik sokaságot másik 15%-nak a 15%-val tudsz lefedni, hogy ilyen földhözragadt példákat hozzak.

    Azt kellene végre megértened, hogy a kiválasztott népcsoportra ad jó megközelítést, és ezt nem vetítheted át a teljes népességre

    így van. akkor ebben egyetértünk. ha a népességet felosztod több részre és a kiválasztott népcsoportokat le tudod fedni mintákkal, akkor a kiválasztott népcsoportok szokásait tudod modellezni a minták szokásaival. innen már csak egy lépés, hogy a hazai statisztikák alapján a kis csoport súlyozása segítségével reprezentáld a népességet.
  • winnie
    #25
    addig tudod a mintát csökkenteni, amíg a hibahatár tűréshatáron belül van
    És meddig van a hibahatár tűréshatáron belül ???


    azt a kliens vagy a megrendelő határozza meg. általában 5% (+/- 2,5%). ez 1,5M-ós nézettsgnél kiszámolhatod hogy mennyi.
  • mrzed001
    #24
    1. a felmérés nem arra való, hogy egy olyan részre "átnyomjuk", aminek a sokaság csak kis keresztmetszete. (analógia: a magyar nézettséggel nem lehet világnézettséget becsülni, mint ahogy meg sem próbáltam itt)
    Na itt áljunk le egy pillanatra. Szóval a világ 15%-ának a 15%-ának ... az x%-éka szóval már szerinted sem fedi le a teljes mintát. Hát éppen erről beszélünk, ezt próbáljuk megértetni veled. A nézettségi minták sem mások, kiválasztásra kerül egy Mo-nyi a világból, és ez alapján mondanak világszámokat. És itt van amit annyit mondogatok, hogy közelíteni lehet (mintanagyságtól függően) a valósághoz, de minél kisebb a minta annál nagyobb a hiba. (és ha csak a magyarokat méred, nem mondhatod, hogy ez a világstatisztika, mert felszoroztam 1000-el)

    gondolom abban egyetértünk, hogy egy random szavazás nem csaka 16-35, netes b-re bejutottak esetében ad jó eredményt 1%-ra
    Azt kellene végre megértened, hogy a kiválasztott népcsoportra ad jó megközelítést, és ezt nem vetítheted át a teljes népességre (nem szorozhatod fel). Ezt próbáljuk itt magyarázni ...
  • mrzed001
    #23
    addig tudod a mintát csökkenteni, amíg a hibahatár tűréshatáron belül van
    És meddig van a hibahatár tűréshatáron belül ???
    1/10000-ig, az 1%-nak az 1%-áig ?? Vagy előző példával élve a 15%, 15%-ának, 15%-ának, 30%-áig ??

    fénymásolós példád tökéletes. az első, második, ötödik másolat még jó és viszonylag korrektül visszaadja az eredetit. a 28. már nem. cél: megtalálni, hogy még hanyadik másolás fér bele egy 5%-os hibahatárba
    Mint írtam is mivel az digitális, azért nem tökéletes példa. Ha egy random függvény mondaná meg lépésenként, hogy ezt a pontot otthagyom, vagy módosítom, akkor lenne tökéletes példa (most írjak rá egy példaprogit? :pp)

    Úgy mellesleg visszatérve a 15% mennyire pontos eredmény kérdésre, nos ezt sajna nehéz megállapítani. A leves példával élve, ha mélyre nyúlsz, túl sok lesz a tészta, ha fentre túl kicsi (szóval mérésfüggő, és LEHETETLEN pontosan az teljesen megegyező eloszlást elérni). Amit írtam előzőleg hibaszázalék a gépészetben használt, gyártott termék mérésére vonatkozott (talán ezért >50%-os ugyebár pölö egy tengely gyártásánál a legyártott termékek méretének mérése pölö lézerrel). Ha nem tennék, akkor a kocsidban a dugattyú első indításra beragadna/besülne, mert nem felel meg a tűrésnek
  • Komolytalan
    #22
    "ne tereld el a témát hülye számolásokkal (a 15%-t meg a példa kedvéért mondtam). míg te lebontod két emberre mintát, addig a hibahatár hihetetlen módon megnő. hasra csapok. ha van egy 1,11-szeres szorzód, akkor 1,11*1,11 még tűrhető. 1,11 a harmadikon is, de egy idő után hatalmas lesz a hibahatár. (sorry. azt hittem érted mire gondolok a kumulált szorzásnál.)"
    Fogd már fel, hogy a kommulált szorzás nem takarja a valóságot. A kommulát szorzás eredménye csak nagyon speckó esetben (N. gyök alatt 2 esetén) fog az N. lépésben 1-et adni, ami ugyebár az volna, hogy ha 1 emberre szűkíted le a mintacsoportot, akkor a pontatlanság 100%. tehát mondjuk 11% pontatlanságnál már lehet hogy kijön, de se 10, se 12% pontatlanságnál nem. Más kérdés, hogy a 100% persze nem 100% kellene hogy legyen, mert ha most azt mondom hogy MSZP, akkor a választások után kb 40-60% emberrel egyezik amit mondta, tehát csak a maradék 60-40% a hibahatár, aminek ki kellene jönnie. Vagyis eseményfüggően 0 és 100% közötti értéknek kellene kijönni. Szóval ez az egész kommulált-szorzásos duma amit nyomsz ez jól hangzik, de _semmi_, aszolúte _semmi_ tudományos alapja nincs (hiszen már ketten is bebizonyítottuk hogy rossz).
  • winnie
    #21
    És akkor ne felejts el, hogy 1%, nem 0,01% amihez hasonlítod.

    te se feledd, hogy az 1% az totál random minta, nulla reprezentativitással.

    Meg azt se felejtsd el, hogy ez csak a népesség egy szűk részét érintő felmérés (16-35 év közötti, nettel rendelkező, B-re valahogy bejutott egyének)

    adva van egy bizonyos csoport - és azon belül a végeredmény az eloszlás. ugyanez nagyban - adva annak a magyar tévénézők és a végeredmény az az eloszlás.

    Szóval te ezt követően nehogy felszorzod a számokat, és azt mondod, hogy 10M x 16% = 1,6 M magyar "kedveli" az anyósát, és 10M x 41% = 4,1M magyar "csak anyós jelölt van és kedvelem" az eredmény !?!

    megint félreértesz. a szavazás egy sokaságra vonatkozik

    1. a felmérés nem arra való, hogy egy olyan részre "átnyomjuk", aminek a sokaság csak kis keresztmetszete. (analógia: a magyar nézettséggel nem lehet világnézettséget becsülni, mint ahogy meg sem próbáltam itt)

    2. és persze attól, hogy van pár közös pontjuk még ugyanúgy van rengeteg különböző. de. ha a "16-35 év közötti, nettel rendelkező, B-re valahogy bejutott egyének" 1%-os nem reprezentatív minta alpján fedik a 100% véleményét (hibahatáron belül), akkor ugyanígy fedhetik más (valamilyen jellemzők által kiválasztott) kis csoportok 1%-a is a 100% véleményét. ez a stat lényege. hogy kis csoportok segítségével lefedje a teljes intervallumot. hogy sok kis 1% segítségével lefedjünk olyan 100%-okat, melyek összessége kiadja a magyar népességet.

    (gondolom abban egyetértünk, hogy egy random szavazás nem csaka 16-35, netes b-re bejutottak esetében ad jó eredményt 1%-ra)
  • winnie
    #20
    Tehát a te elméleteddel élve én meg a TóthOttó ketten megmondjuk, hogy most szombaton a BSG-t 823421 nézték (így előre, mert úgy mellesleg mi jósok is vagyunk :pp)

    (itt kezdődnek a bajok, nem az én elméletem. nem én találtam ki a statisztikát)

    ne tereld el a témát hülye számolásokkal (a 15%-t meg a példa kedvéért mondtam). míg te lebontod két emberre mintát, addig a hibahatár hihetetlen módon megnő. hasra csapok. ha van egy 1,11-szeres szorzód, akkor 1,11*1,11 még tűrhető. 1,11 a harmadikon is, de egy idő után hatalmas lesz a hibahatár. (sorry. azt hittem érted mire gondolok a kumulált szorzásnál.)

    addig tudod a mintát csökkenteni, amíg a hibahatár tűréshatáron belül van. ha nincs érved, akkor fogadd el, de felesleges folytonos tagadásba menekülni. ha van, akkor nosza.

    (a fénymásolós példád tökéletes. az első, második, ötödik másolat még jó és viszonylag korrektül visszaadja az eredetit. a 28. már nem. cél: megtalálni, hogy még hanyadik másolás fér bele egy 5%-os hibahatárba)
  • mrzed001
    #19
    de, ha akarod. azt mondod, hogy elfogadod a 15%-osat? az már absz. hibahatáron belüli becslést ad. akkor ezt lebonthatjuk és elég csak ennek a 15%-át vizsgálni. és ez a menete a statnak ....
    10M ember -> megbecsülhető nagyon jó 1.5M-ból. akkor az 1.5M is 225ezerből. vagyis a 10M-ra is elég a 220ezer. az pedig már csak 2%. a többi csak matek. meddig lehet lebontani.

    Szerintem itt ne hagyd abba :D
    10 M 15%-a 1,5 M
    1,5m 15%-a 225 e
    225e 15%-a 34 e
    34 e 15%-a 5 e
    5 e 15%-a 760
    760 15%-a 114
    114 15%-a 17
    17 15%-a 2

    Tehát a te elméleteddel élve én meg a TóthOttó ketten megmondjuk, hogy most szombaton a BSG-t 823421 nézték (így előre, mert úgy mellesleg mi jósok is vagyunk :pp)
    Szerintem legkésőbb itt már látnod kellene, hogy miről is beszélek. Hogy miért nem igaz az alapállításod, és hogy mit is jelent a vételi minta "romlása". Mint amikor egy fénymásolatot tovább fénymásoltál egy régi másolóval (sőt, ez egy túl szép példa, ennél az élet sokkal kevésbé digitális).



    220 szavazatnál: 13 - 5 - 44 - 12 - 6 - 11 - 9
    1132szavazatnál: 14 - 5 - 44 - 10 - 5 - 11 - 11
    2440szavazatnál: 16 - 4 - 41 - 10 - 6 - 11 - 13

    majd amikor bejön a 8-9000 szépen le lehet vonni a következtetést.

    Nos, várom, ha a 10000. meglesz, hogy a 0,01% mért eredménye (azaz 1 db szavazat) egyezik-e vele :ppp

    úgy lenne a logikus, ha az első és/vagy az utolsó növekedésnek indult oszlop tovább nőne a harmadik kárára, mondjuk. aztán lehet, hogy nem így lesz, de kiderül, hogy mennyire fedi le az 1%-os első eredmény az összes felhasználót
    És akkor ne felejts el, hogy 1%, nem 0,01% amihez hasonlítod. Meg azt se felejtsd el, hogy ez csak a népesség egy szűk részét érintő felmérés (16-35 év közötti, nettel rendelkező, B-re valahogy bejutott egyének)
    Szóval te ezt követően nehogy felszorzod a számokat, és azt mondod, hogy 10M x 16% = 1,6 M magyar "kedveli" az anyósát, és 10M x 41% = 4,1M magyar "csak anyós jelölt van és kedvelem" az eredmény !?!
    Nagyon, nagyon nem valószínű :ppp
  • Komolytalan
    #18
    Szóval csak azt akarom mondani, hogy matekra ne hivatkozz, ha olyan sarlatánságok mellett érvelsz, mint a statisztika. A matematika nem következtet semmire se úgy, hogy az nem biztos. Max megmondja, hogy egy 850 fős felmérés 10000000 főre vetített statisztikája 0.07% valószínűséggel 1%-nál kisebb eltéréssel közelíti a valóságot:-P
  • Komolytalan
    #17
    "10M ember -> megbecsülhető nagyon jó 1.5M-ból. akkor az 1.5M is 225ezerből. vagyis a 10M-ra is elég a 220ezer. az pedig már csak 2%. a többi csak matek. meddig lehet lebontani."
    Itt valami olyasmit mondasz, hogy adott egy 10M alapcsoport, és ennek 1M fős mintacsoportja, mondjuk 1% becslési eltéréssel. Ebből te levonod azt, hogy ha csak 100ezer a mintacsoport, az ugye ugyanúgy 10%-a az 1M-nak, vagyis ahhoz képest szintén 1% pontatlanságot fog generálni, és ezek az 1%-ok összeadhatóak (vagy 101%-ok szorozhatóak). Tehát 1M fő 1%, 100ezer fő 2%, 10ezer fő 3%,... 1 fő 7% pontatlanság. De ha szorzással számolunk is (1.01^7)-1=0.072=7.2%. Szóval itt nagyot csúsztattál apa, nem vagy te statisztikus? :-D Mert nekem van matek diplomám, szóval ne akarj a statisztika áltudományával megvezetni.
  • mrzed001
    #16
    ha valami, akkor a tendencia az nem tipp, hanem kiolvasható az adatokból.
    LOL. Ennek a 850 családnak a tendenciája olvasható ki az adatokból, NEM a teljes népességé (az csak jó megközelítéssel saccolható belőle)

    így van, de az otthon van, aki az előző héten volt színházban, stb. (erre mondom, hogy egyirányban gondolkodsz) ezek kiegyenlítik egymást - erre van a korrekciós tényező és a hibaszázalék.
    Az élet nagyon elszaladt a fantáziád mellett. Pontosan erre írtam, hogy ez egy kapitális baromság, mert ennek köze nincs egy egyenletes eloszláshoz (ezek a random módosítók, amik >5%-osan befolyásolhatják a 850-es számokat, amik felszorozva ~500.000 eltérést okozhatnak a teljes állományban)

    ez nem így működik. ennél egzaktabb tudomány a stat. nehogy azt mondd, hogy szerinted úgy számolják, hogy megnézik, hogy a 2512 emberből háény nézi és felszorozzák egy szorzóval? (ráadásul nem egyénekre lebontva képviseltetik a mintatagokat)
    Két metódus van, az első szerint az egyének számát súlyozottan felszorozzák (pl hány annyi éves van), a másik szerint beleteszik egy kategóriába (itt már pl nem csak az év (vagy TVbuzie), hanem egyéb paraméterek szerint pölö végzettség, panel/házban lakik ...) és ezt szorozzák fel a hasonlók saccolt számával
    Szóval de, lényegében felszorozzák egy szorzóval, és kész :p


    de ne feledd, hogy van 1000 és 1500-as felmérés, volt, aki a legvégén egy gyors telefonos kutatást csinált és, a biztos pártválasztó-számok között voltak eltérések, melyek a megnőtt bizonytalan számok miatt sokkal kisebb mintát generáltak (csekk politikai évkönyv 2003, nagyon szépen le van vezetve minden) - de a lényeg, hogy nem pontosak a számok
    Nos, mennyivel voltak azok pontatlanabbak, mint a feleakkora állományban végzett mérések? Persze, az egyik csalt erre, a másik arra, de ki mondta neked, hogy ezt csak a pártok kedvéért teszik meg? Kishazánk nem csak abszurdisztán, de korrubszisztán is :p
    És gondolom neked nem kell sorolnom, hogy csak eddig hány (kiderült) igenkomoly ilyen csalás volt az amcsi tv-knél

    matek nem 20-25% szórás, hanem 20-25 százalékpont. közel sem mindegy.
    Kimaradt egy betű, helyesen: 20-25%p :))

    nem az egy ellenpéldára vagyok kíváncsi - ha nem a többire. nem azzal fogsz megcáfolni, hogy lám, ekkor nem így volt, mert akkor komolytalan, hogy figyelmen kívül hagyod a sokkal több példát aamikor így volt.
    Magyarán néha jók a saccok, néha rosszak a saccok, de azért te azt mondod, hogy kezeljük őket pontos számadatként??? Azaz ha valamelyiket 100.000-el többen nézték a sacc szerint, akkor azt tuti 100.000-el többen nézték? Vagy 200.000-el többen nézték? Vagy nem is nézték többen ? Honnan fogod te megmondani, hogy ez most egy tényleges felmérés eredménye, vagy valaki éppen manipulálgatja a számokat ? SEHONNAN. (vagy statisztikázzunk, hogy kik mennyit statisztikáztak félre )
  • winnie
    #15
    hmm, hova lett.
  • winnie
    #14
    tetsuo, csak ugyanazt tudom mondani, amit az előbb. hogy meg kell találni a határt, amíg belefér a játszadozás. (ha belemersz egy összekavart levesbe, akkor mekkora merőkanál kell, hogy minden adalékból kapj - ehhez nincs szükség a teljes levesre. eljutottunk a 15%-ig és ennek a 15%-áig.)
  • winnie
    #13
    Na vajon miért ? Megsúgom, MERT MÁR 15%-OS VOLT A FELDOLGOZOTTSÁG. Nem 0,015%-os, szóval 1000x pontosabb.

    teljesen félreértesz, ez alma és körte. nem erre céloztam, hanem arra, hogy nincs ingadozás - te pedig 100%-ot említettél. de így is rávezethetlek, ha gondolod.

    de, ha akarod. azt mondod, hogy elfogadod a 15%-osat? az már absz. hibahatáron belüli becslést ad. akkor ezt lebonthatjuk és elég csak ennek a 15%-át vizsgálni. és ez a menete a statnak - olyan mintát kell választani, ahol a kumulált (az összeadást jelent, nemtom, hogy a szorzáskumulációnak mi a neve) eredmények még hibahatáron belül maradnak.

    10M ember -> megbecsülhető nagyon jó 1.5M-ból. akkor az 1.5M is 225ezerből. vagyis a 10M-ra is elég a 220ezer. az pedig már csak 2%. a többi csak matek. meddig lehet lebontani.

    ezt akartam mutatni a szavazáspéldával. ha gondolod megjátszhatjuk. említettem a példámat, hogy 0,5% abszolút lefedte a sokaság véleményét - nem reprezentatív minta esetén.

    ma délután a nagy-nagy magyar torrentoldalon így alakult a szavazás - ha gondolod bármelyiken megpróbálhatjuk újra, hmm? (vakhit, de hiszem, hogy hasonló lenne az eredmény)

    család szociál felmérésünk következik. anyósom...
    a.)kedvelem
    b.)nem kedvelem
    c.)csak anyós jelölt van és kedvelem
    d.)csak anyós jelölt van és nem kedvelem
    e.)már kivégeztem
    f.)kivégzése tervben van
    g.)épp most végzem ki

    220 szavazatnál: 13 - 5 - 44 - 12 - 6 - 11 - 9
    1132szavazatnál: 14 - 5 - 44 - 10 - 5 - 11 - 11
    2440szavazatnál: 16 - 4 - 41 - 10 - 6 - 11 - 13

    majd amikor bejön a 8-9000 szépen le lehet vonni a következtetést. úgy lenne a logikus, ha az első és/vagy az utolsó növekedésnek indult oszlop tovább nőne a harmadik kárára, mondjuk. aztán lehet, hogy nem így lesz, de kiderül, hogy mennyire fedi le az 1%-os első eredmény az összes felhasználót
  • winnie
    #12
    Tendenciát lehet tippelni ezekből a hasszámokból

    ha valami, akkor a tendencia az nem tipp, hanem kiolvasható az adatokból.

    másik éppen vidéken van a szülőknél, a harmadik éppen szülinapos, a negyedik éppen színházba van ....

    így van, de az otthon van, aki az előző héten volt színházban, stb. (erre mondom, hogy egyirányban gondolkodsz) ezek kiegyenlítik egymást - erre van a korrekciós tényező és a hibaszázalék.

    ehát könnyen előfordulhat, hogy a 850-ből pl 4 család utazik el, rontva ezzel ~100.000-el a nézettségi statisztikát,

    ez nem így működik. ennél egzaktabb tudomány a stat. nehogy azt mondd, hogy szerinted úgy számolják, hogy megnézik, hogy a 2512 emberből háény nézi és felszorozzák egy szorzóval? (ráadásul nem egyénekre lebontva képviseltetik a mintatagokat)

    Az egyiknél a F. 15%-al vezetett, a másiknál a M. vezetett 10%-al ... kb 20-25% volt a szórás a 3 felmérés között.

    1. nem pontosak az adatok (vagy gimmi forrás), voltak eltérések, de ne feledd, hogy van 1000 és 1500-as felmérés, volt, aki a legvégén egy gyors telefonos kutatást csinált és, a biztos pártválasztó-számok között voltak eltérések, melyek a megnőtt bizonytalan számok miatt sokkal kisebb mintát generáltak (csekk politikai évkönyv 2003, nagyon szépen le van vezetve minden) - de a lényeg, hogy nem pontosak a számok.

    2. matek nem 20-25% szórás, hanem 20-25 százalékpont. közel sem mindegy.

    nem az egy ellenpéldára vagyok kíváncsi - ha nem a többire. nem azzal fogsz megcáfolni, hogy lám, ekkor nem így volt, mert akkor komolytalan, hogy figyelmen kívül hagyod a sokkal több példát aamikor így volt. (tudjuk, hogy a közvélemény kutatásokkal lehet befolyásolni a szavazókat, tudjuk, hogy vannak ártközeli kkutató cégek (tárki, szonda) és tudjuk, hogy a politikai hangulatban voltak rejtőzködők)
  • mrzed001
    #11
    Véger írtál valamit, amivel lehet vitatkozni :)
    Na lássuk:
    az idősorokat, a cserélődő minta által produkált hasonló eredményeket, a tendenciákat.
    Pontosan! Tendenciát lehet tippelni ezekből a hasszámokból (tehát a vizsgált csoport TV nézési szokásaiban bekövetkezett változásokat!) NEM azt hogy akkor mégis a jónép teljesegészében hányan is nézik

    te valamiért úgy gondolkozol, hogy ha kijön egy reprezentatívkismintás eredmény, akkor az nagyobb mintán elkezd össze vissza ingadozni
    Igen, mert a 850 családból csak most az egyik gyereknek eltört a keze, ezért nem nézi éppen senki a tv-t, a másik éppen vidéken van a szülőknél, a harmadik éppen szülinapos, a negyedik éppen színházba van .... amire mondhatnád, hogy persze a jónép egy része is éppen ezt teszi (ami egy hatalmas marhaság lenne :p), ugyanis az arányok előre nem megállapíthatóak (attól hogy a 850-ből egy éppen balesetet szenvedett ugyebár nem kell kimenni és 5000 embernek eltörni a karját :pp). Ez az egyik része annak a "teljes 5%-a a hiba", amit előzőleg lent már próbáltam vázolni

    vagyis nemcsak pro tévedhet a statisztika, hanem kontra is - és ezek a tévedések hibahatáron belül kiegyenlítik egymást - erről szól ez a tudomány
    Egyenletes eloszlást alapul véve. Egy dolgot azonban figyelmen kívül hagysz: az eloszlási görbe a 850-es állományra igaz. Csakhogy a 850 annyira kicsi szám, hogy az eredeti 6-8 M tört részét képviseli mindössze. Tehát könnyen előfordulhat, hogy a 850-ből pl 4 család utazik el, rontva ezzel ~100.000-el a nézettségi statisztikát, míg valójában ugyebár aznap nem utazott el ennyi ember
    És lehet erre azt mondani, hogy megfelelő statisztikai modellekkel összeállítható a társadalom minikészlete, de ez ugyebár egy egyetemes marhaság, mert nem veszi figyelembe az egyént és egyéni döntéseket

    1500 főből készítik a közvéleménykutatásokat. 1500. 4 cég. az éves szinten 48 felmérés és az eredmények mind tendenciózusak, sosincs olyan, hogy egyiknél az egyik, mésiknál a másik vezet
    Hohóóó. Darázsfészekbe nyúltál :) Ha éppen az utolsó szavazásra visszagondolok, ott ugyebár 3 közvéleménykutató 3 különböző eredménnyel állt elő. Az egyiknél a F. 15%-al vezetett, a másiknál a M. vezetett 10%-al ... kb 20-25% volt a szórás a 3 felmérés között. Számszerűsítve ez >1 milliós eltérés emberszámban (5-6 M teljessel számolva). Nem csak hogy a szavazás kimenetelét nem találták el ketten, de 1 millióval tévedtek. Ugyanekkora állományra vonatkoznak a nézettségi statisztikák, DE ott még kisebb a mért aránya, tehát még nagyobbak lehetnek az eltérések. Belegondolva, hogy esetleg a 600.000-es nézettség (az előző tévedést hozzáadva) lehet 1.600.000 is, nos mersz te még hinni neki? :DD

    gondolj a választásokra. már 15-20%-os feldolgozottság mellett lehet tudni a végeredményt.
    Na vajon miért ? Megsúgom, MERT MÁR 15%-OS VOLT A FELDOLGOZOTTSÁG. Nem 0,015%-os, szóval 1000x pontosabb. És itt is még vannak változások, de jóval kisebbek, mert régiónként aránylag egyenletesen folyik a szavazatszámlálás, ÉS nincs elkülönülés (azaz pölö hogy a gazdagabb réteg csak délután megy szavazni).
    Ilyen egyszerű ez kérem :))
  • winnie
    #10
    például mivel magyarázod ezeket a szimpla semmi reprezentatív mintás random szavazásokat?
  • winnie
    #9
    válaszolj azért a kérdésekre.

    Sőt, éppen hogy te vagy az, aki semmiféle érveket nem hoz fel a maga igaza

    annyi mindent írtam már, vissza tudod olvasni... az idősorokat, a cserélődő minta által produkált hasonló eredményeket, a tendenciákat.

    50% esetén már ~10%-os lehet a tévedés, 1% körül már >30%-os

    ó, ne legyél már lol. vagy komolyan veszed vagy hülyeségeket írsz. olvass némi statisztikát, könyvet, passz.

    te valamiért úgy gondolkozol, hogy ha kijön egy reprezentatívkismintás eredmény, akkor az nagyobb mintán elkezd össze vissza ingadozni, holott csak kis eltéréseket fog mutatni a bővítéssel, hibahatáron belül. (neked az a tévképzeted, ha hiba van a mátrixban, akkor az egyoldalú, vagyis aki kimarad annak más a preferenciája (nézi a scifit) - de azt nem veszed számításba, hogy az is előfordulhat, hogy egy scifi-néző olyan preferenciát képvisel, amit az álatala képviseltek nem - vagyis nemcsak pro tévedhet a statisztika, hanem kontra is - és ezek a tévedések hibahatáron belül kiegyenlítik egymást - erről szól ez a tudomány.)

    ha kiírsz egy szavazást egy 20ezres kommunitiben, legyen ez az sg.hu, de múltkor pont erről dumáltunk és az egyik torrnetoldalon is kitettünk egy szavazást - akkor a 100 szavazat utáni eredményből le lehetett szűrni, hogy mennyi lesz a végeredmény, az akkor kapott százalékok már csak hibahatáron belül változtak (+/- 1 százalék) --> vagyis egy 0,5%-os minta válaszaiból is következtethetsz a sokaság véleményére.

    ha nem megy a tudományos alap (amit nem fogok leírni, nem vagyok statisztikus), akkor konkrét példák és nem mondhatod, hogy nem támasztom alá.

    dettó pártpreferenciák. 1500 főből készítik a közvéleménykutatásokat. 1500. 4 cég. az éves szinten 48 felmérés és az eredmények mind tendenciózusak, sosincs olyan, hogy egyiknél az egyik, mésiknál a másik vezet, ugyanakkor történik a csökkenés - és nagyjából leeképezik a választásieredményt is (pláne, ha a kispártokat nézi az ember, ahol pedig aztán tényleg lehetne bőven eltérés.)

    (gondolj a választásokra. már 15-20%-os feldolgozottság mellett lehet tudni a végeredményt. ahogy nőtt múltkor a feldolgozottsági szint az szdsz úgy emelkedett lassan 4,2%-ról. lehetett tudni, hogy a tendencia nem fog megállni és el fogja érni az 5%-ot - mint ahogy a miép csökkenésnek indult és végig folytatta a csökkenést. egyik párt eredményei sem úgy működtek, hogy elindul felfele, majd hirtelen lefele, majd ismét fel)
  • winnie
    #8
    nem a módszer a lényeg, annak nyilván megvannak a baromságai - az a vita tárgya, hogy a vizsgált sokaságnak mekkora része reprezentálja a szokásokat.

    Ettől még az is 1000x pontosabb lenne (

    na, azért ne naivkodd el a dolgot. sokan elfelejtik, ogy mit néznek, sokan hazudnak.
  • mrzed001
    #7
    Általában komolytalan vagy Komolytalan, de ez most egy teljesen komoly hozzászólás volt :). Komolyan :))
    Nem elbízni magad, azért van még hova fejlődni :))
  • Komolytalan
    #6
    Egyátalán nem beszél hülyeséget a srác. AGB mérés egy rakás trágya úgy ahogy van. Pl. a családtagoknak egy külön távrángatón meg kell nyomniuk a gombot amikor leülnek a tv elé, egy másikon meg mikor felállnak előle, meg hasonló baromságokon alapul. Már csak magamból kiindulva eléggé optimista felvetés az, hogy majd reklám alatti pisilés előtt meg után távrángatót nyomkodjak. És pl. ebből hozzák ki azt, hogy reklámok között nem mennek ki az emberek a tv elől.
    Ettől még az is 1000x pontosabb lenne (meg olcsóbb), ha felhívnák az embereket telefonon, hogy "Erőt egészséget, a dolgozó népet szolgáljuk! Megmondaná bátyám, mit nézett tegnap este a TVben? - Úgy, a Győzikét? Hát, van rajta mit nézni, szép nagy marha cigány gyerek, hogy a tűz égesse ki a szemit. Osztan közbe látta-e a Patakparti Késdobáló vendéglátóegység reklámját? - Értem, szóval reklám alatt megvacsorázott a család. Jobban is jártak mintha a Késdobálóba mentek vóna. - Oszt mi vót vacsorára? -Töpörtyű? Fínom is az, szeressük mink is az asszonnyal. Nem, köszönöm, mi is vágtunk disznót a mút héten, le is teszem inkább mert csődbe megy a közvéleménykutató. Viszonthányásra!"
  • mrzed001
    #5
    Öööööö
    winnie átmentél write only userbe, vagy csak nem látod számokat?
    Sőt, éppen hogy te vagy az, aki semmiféle érveket nem hoz fel a maga igaza mellett, csak leugáz hogy jóez/pontosez. Érveket, hiányoljuk azt nagyon [/yoda]

    Hogy hány százalékot kellene vizsgálni ?
    Mint a statisztatikával több oldalról is foglalkozó ember (pl: gépészet-minőségellenőrzés) erre azt mondanám, hogy 100% :p
    Minél jobban csökkentjük a méretét, annál jobban nő a tévedési %
    50% esetén már ~10%-os lehet a tévedés, 1% körül már >30%-os, 0,01%-nál pedig ... hát erről már nincs adatom, de hasra 50-70%-ot besaccolok
    De lássuk a te érveidet is, mert szeretnék végre valami megfogható dologgal vitatkozni, nem ezzel a deezígyvanésígyjóéstudjákmitcsinálnak dumával
  • winnie
    #4
    továbbra sem hozol fel érveket. de hagyjuk. továbbra is becsukod a szemedet, nem érdekelnek a bizonyítékok és csak azt hajtogatod, hogy a scifi esetében a nézettség vizsgálat lefele csal, a barátok közt esetében felfele.

    1.jól értem?

    2. szerinted hány százalékos reprezentatív minta kéne egy sokaság szokásainak (nézettség, pártpreferencia) megállapításához a te elméleted alapján)?

    a bsg nézettségéről mi a véleményed?

    (az a baj, hogy ez olyan gumicsont, amire frankón lehet hivatkozni azoknak, akiknek lövésük nincs a statisztikához - de sajnos a tendenciák, az adatok idősoros elrendeződése azt bizonyítja, hogy nagyon jó közelítéssel igazak az adatok.)
  • mrzed001
    #3
    Egyetértek, viszont az a baj, hogy nem csak a szárnyasbetét reklám árának kiszámolásához használják, hanem pölö filmek és sorozatok nézettségének megállapításához.
    És az igazi gond itt kezdődik, hogy a hasra 1,1 milliós nézettségű film JOBB mint a hasra 0,9 M nézettségű másik
    Valójában ez lehet éppen fordítva is, sőt lehetett akár 1,5-2x akkora a rossznak kihozott film nézettsége, mint a jobbnak (arra pedig ugyebár ne is gondoljak, hogy mennyi de mennyi visszaélésre derült már fény ilyen cégekkel kapcsolatban ;p )
  • Commandante
    #2
    Abban teljesen igazad van, hogy ez az egesz statisztikailag lehetetlen. Az adataik ugy hasznalhatatlanok, ahogy vannak. Dolgoztam mar veluk, es annyit lehetett 100%-os biztonsaggal megallapitani, hogy nyaron kevesebben TV-znek, mint telen. Na bumm, ez aztan eredmeny.

    Viszont nem is ez a lenyeg, hanem az, hogy - tudtommal - minden TV csatorna ezt a ceget hasznalja a nezettseg meresere, ergo igy az adataikat mindenki elfogadja. A hirdetok is. Namar most ha ket konkurens ceg egymastol eltero adatokat produkalna, akkor te melyiknek hinel, amikor a szarnyatlan-betet reklamod koltsegeit es nezettsegi adatait eled teszi a TV tarsasag? Ez a piac csak egy ceggel mukodokepes.
  • mrzed001
    #1
    850, húúúú hogy oda ne oldalazzak :DD
    ez magyarán annyit tesz, hogy 8,5 Millió ember TV nézési szokását "saccolják" meg 850 * (2-3 ember/háztartás) kiválasztott alapján (tehát minden egyes kiválasztott háztartás ~6-10.000 ember helyett "voksol", azaz mindössze a lakosság 0,01-0,03%-a mért ténylegesen)
    Mivel a félrevezető adat/bekapcsolva felejtette/csak szóljon valami a háttérben/mérési hiba (ha a teljes lakosságot néznék) akár 5%-os is lehet (ami 500-szorosa a ténylegesen mért 0,01%-os állománynak), így aztán remélem megérti mindenki, hogy az így generált adatok csak hasra számok, és +-50%-ra talán megközelítik a valós adatokat