"Azt olvastam, hogy ha nem tudjuk a "mérendő mennyiségnek a teljes sokaságbeli gyakoriságát", akkor az előző táblázatból az egész sort tekintve a legrosszabb esetre kell felkészülni, tehát hogy 50%-os eredményt kapot és az ehhez járó legnagyobb mintával kell dolgoznom.
Te egyetértesz ezzel?"
Igen. Ha adott hibakorlátot szeretnénk (adott valószínűséggel) elérni és nem tudunk semmit a teljesben vett gyakoriságról, akkor erre a legroszabb esetet kell feltételezni, vagyis 50%-ot, a mintaméret meghatározásánál.
"Ennek a néhány infónak a tulajdonában én nekem képesnek kell lennem eldönteni az optimális mintát?"
Igen.
(Persze ez a táblázat olyan esetre vonatkozik, ahol a feltett kérdésre két válasz lehetséges)
Yessss...azt hiszem én is így érettem a dolgot, már ami a hibahatárt jeleni.
Köszönöm nagyon sokat segítettél!!
Talán abban is tudnál adni nekem tanácsot, hogy...
Egy kutatási tervet kell készítenem, telefonos megkérdezéshez.
A célcsoportról azt tudom, hoigy járnak barkácsáruházba.
/egyenlőre a lehetséges költségvetésről sem/...
Tehát nem tudom a "mérendő mennyiségnek a teljes sokaságbeli gyakoriságát" előre. Legtöbbször azért így van gondolom.
El tudom dönteni mekkora mintán kell dolgozzak, hogy használható eredményeket kapjak a végén???
Gondolom el kell dönteni:
1. mekkora hibahatárt engedek meg (ez már kicsit szűkíti a kört)...továbbá
2. át kell gondolnom miféle eredményeket kaphatok (pl márkahasználat során, melyik márkát milyen gyakran használják...ilyesmi)
3. milyen mélyen szeretném majd elemezni az eredményt (mennyire bontom az eredményt)
4. mennyi pénzem van a kutatásra
Azt olvastam, hogy ha nem tudjuk a "mérendő mennyiségnek a teljes sokaságbeli gyakoriságát", akkor az előző táblázatból az egész sort tekintve a legrosszabb esetre kell felkészülni, tehát hogy 50%-os eredményt kapot és az ehhez járó legnagyobb mintával kell dolgoznom.
Te egyetértesz ezzel?
Ennek a néhány infónak a tulajdonában én nekem képesnek kell lennem eldönteni az optimális mintát? Vagy be kell szerezzek még más információt is?
Azon gondolkodom, hogy esetleg már tudnom kéne milyen kérdéseket fogok feltenni (hány válasz lehetőség van egy kérdésre ilyemi)
"A társadalom- és marketingkutatások terén általában a t = 2 megbízhatósági tényezőt alkalmazzák, ami azt jelenti, hogy 1000 elemszámú mintából 955 a megadott hibahatáron belül mozog."
Szerintem ez így zöldség.
Azt kéne, hogy jelentse, hogy adott elemszámú mintákkal dolgozva a minták 95.5%-a a (mérendő mennyiség gyakorisága és a minta mérete által meghatározott)
hibahatáron belüli eredményt ad.
"Tehát úgy kell értsem, hogy ha például én 576 főt kérdezek meg és az eredmény 90%, vagy 10%, akkor a hibahatár 2,5%? Ergó, lehetne a 90%, akár 90%-2,5%, vagy 90%+2,5%?"
A táblázatod sorai a hiba nagyságát, oszlopai a mérendő mennyiségnek a teljes sokaságbeli gyakoriságát adják meg.
Tehát szerintem úgy kell érteni, hogy ha a teljes sokaságban 90% az előfordulás, akkor a te 576-os mintádban 95.5%-os valószínűséggel 87.5% és 92.5% között lesz az eredmény.
Ugyanekkora mintával, ha 10% a teljes sokaságbeli előfordulás, akkor 95.5% a valószínűsége, hogy 7.5% és 12.5% között lesz a mintában az eredmény.
A táblázat a 95,5%-os megbízhatósági szintre vonatkoznak.
Tehát úgy kell értsem, hogy ha például én 576 főt kérdezek meg és az eredmény 90%, vagy 10%, akkor a hibahatár 2,5%? Ergó, lehetne a 90%, akár 90%-2,5%, vagy 90%+2,5%?
"A társadalom- és marketingkutatások terén általában a t = 2 megbízhatósági tényezőt alkalmazzák, ami azt jelenti, hogy 1000 elemszámú mintából 955 a megadott hibahatáron belül mozog."
Ezt úgy kell értsem, hogy ha pl egy kísérletet megismételnék (azonos kísérlet, azonos mintavételi mód), akkor ha 1000x megismételném....955 esetben olyan eredményt kapnék, ami az adott hibahatáron belül mozog. És csak csak 5 esetben lenne a végeredmény a hibahatáron túl?
Jól értem, vagy nagyon rossz helyen tapogatózom...?
Messze nem látom a feladat megoldását (el is felejtettem ultizni), de annyit tudok, hogy a nem teljes információs játékoknak iszonyatos mélységei lehetnek. A sima Texas Holdem pókerre (ami jóval egyszerűbb mint az ulti) 16 éve fejlesztik az A.I.-t az Albertai egyetemen (kicsit egy időben olvasgattam, hogy mit csinálnak, nagyon nem triviális), és csak ma kezdi mgverni az igazán profi pókereseket. (Vessük ezt össze azzal, hogy a sakkban már a világbajnokot régebben veri a számítógép). És akkor csak az ember megveréséről van szó, nem valamiféle 'tökéletes' játékról.
Kicsit tűnődtem ezen a feladaton. Tegyük fel, valahogy elpucoljuk az említett elvi gondokat további szabályokkal.
Az első kör utáni helyzet már elvileg egyszerű, csak kézzel borzasztó hosszadalmas. Tipikus PC-nek való feladat: minden lehetséges lapállást egyenként ledarálni nyers erővel. Minden lapállásban az összes játszma kiértékelése minimax algoritmussal. Mivel nincs túl sok lépés, sacc/kb ez belátható futási idővel lemenne.
Az első kör azonban nagyon gáz. Ötletem sincs, mit lehetne csinálni. A játékosok számos leosztás esetén döntési helyzetben vannak, és csak annyit tudnak hogy mi a bemondás, mi a saját lap és mit hívtak le. Ebből kell dönteniük, és a döntésük befolyásolja azt, hogy mi a lapállás az első kör lefutása után, vagyis ezzel még helyesbíteni kellene a fenti esetszámból következő valószínűségeket. Vagyis az adott leosztáshoz tartozó optimális első körös döntést is ki kellene értékelni.
Ráadásul ha az első ellenfélnek is van választása, akkor az optimális döntéshez azzal is kalkulálnia kellene, hogy az utána következő társa hogy fog dönteni - annak döntésénél pedig bemenő adat az is hogy mit tesz le. Ez egy olyan visszaható dolog, amit én valószínűleg soha az életben nem tudnék megoldani.
"Eleve csak akkor értelmes a feladat, ha joggal feltételezzük, hogy a játékosok jól játszanak "
Ez szinte minden játéknál probléma.
A nem teljes információsoknál níilvánvalóan, de a teljes információsok közül is azoknál, amelyeket nem tudunk kiszámolni.
Ha a bemondás után a másik fél még emelheti a tétet (pl. ahogy írtad kontrával) akkor nyilván már eleve erősebb lappal szabad csak az első bemondást is megtenni, mint akkor, amikor a másik félnek máűr nincs lehetősége módosítani.
Eleve csak akkor értelmes a feladat, ha joggal feltételezzük, hogy a játékosok jól játszanak - ha hülyeségeket csinálnak, akkor nyilván nem megoldható, hiszen nincs adat arról, melyik mennyire pancser... :-)
Na most, jó játékos (az előzetes becslésekből láthatóan) ilyen lapból nem mondja be a terített betlit, mert bizonyos elosztásoknál élből kontráznak, és emiatt biztosan negatí a várható eredmény.
Ha pedig már a bemondás se korrekt, akkor számolhatunk-e joggal azzal, hogy értelmes a talon, meg hogy jól játszik?
-------------
Esetleg feltehető a kérdés úgy, hogy maga a játékos kalkulál - bemondható-e a terített betli, mert a valószínűségtől függ a bemondása. E esetben viszont ő tudja, mi van a talonban, vagyis ez bemenő paraméter. Szóval így se gömbölyű a feladat.
Ultis feladat. Valaki terített betlit mond, kézből. Két tököt tesz a talonba. Lapjai: makk: 7,8,9,alsó zöld: 7,8,9,alsó piros: 7 tök: 10 Tökkel indul. Hány százalék esélye van a sikeres teljesítésre?
Ha egymillió kísérletet elvégzel, akkor több mint 61% eséllyel lesz olyan kísérlet, amiben az első 20 érme mind fejre jön ki. Persze elképzelhető, hogy a véletlenszámgenerátor nem igazán jó a programban, ekkor minden megtörténhet. Ezért javaslom, hogy az egymillió kísérletet ne virtuális, hanem igazi érmével végezd.
ez nincs igy. csinalj tobb kiserletet, ne csak negyet. mondjuk legalabb 100-at (akkor mar nagy esellyel lesz benne 14 hosszu sorozat durva fejszamolos becslesem szerint).
Megmondom, egy igen egyszerű(-nek tűnő) kérdésnek szeretnék utánajárni.
Számítógépes kísérlet, 10000-szer feldobsz egy virtuális érmét. Az egymást követő egyesek vagy nullák száma 4 kísérlet alapján maximum 13. Felteszem kvázi végtelen számú kísérletet folytatok. Szerintem azokban sem lesznek mondjuk 17 tagúnál nagyobb sorozatok.
Kérdésem. Van-e valami forrás ami választ ad arra, hogy miért van ez így.
Nem azért tettem fel a kérdést, hogy linkeket kapjak. Az interneten elérhető definíciók ellentmondásosak vagy zavarosak.
Például:
"A szabadságfok az egymástól függetlenül választható tagok (mintaelemek) számával egyenlő. Nyilván, ezek nem lehetnek függetlenek akkor, ha érvényesül köztük egy, vagy több összefüggés. Ilyenkor az összefüggés(ek) számát le kell vonni a mintaelemszámból: a különbség értéke lesz a szabadságfok. "
Egy másik:
"Szabadságfok:. egy adott feladat végrehajtásához szükséges. független paraméterek száma"
Hasonló:
"Szabadságfok: egy rendszer szabadságfokának számán azon független változókat értjük, amelyek helyzetét egyértelműen meghatározzák."
Vagy egy idétlen:
"szabadságfok:
matematikai statisztikai vizsgálatok fontos paramétere. Egy változó ~ a az a szám, ill. számpár, amely megadja, hogy az illető változó hány független, standard normális eloszlású valószínűségi változó négyzetének segítségével írható fel."
Ez meg egy igazi amatőr:
Hogy a t táblázatot használhassuk, meg kell találnunk azt a "sort", amely az adott elemszámnak megfelel. Tehát egy olyan táblázatot képzelhetnénk el, amelynél egy n-nel jelzett elsõ oszlop tartalmazza a minta elemszámát. Csakhogy elõfordul, hogy ugyanezt a táblázatot más problémáknál is használnunk kell (például, két különbözõ elemszámú minta esetén), ahol ennek az elsõ oszlopnak nem lenne értelme. Ezért inkább a szabadságfok elnevezést használják ennek az elsõ oszlopnak a jelölésére. Nem nyilvánvaló, hogy miért. Technikai szempontból azért, mert ugyanez a t-eloszlás egy másik, késõbb tanulmányozandó eloszlással (az ún. c 2 eloszlással) van kapcsolatban, amely eloszlásnál a szabadságfok elnevezésnek szemléletesebb jelentése van. Nekünk elegendõ azt tudni, hogy a populáció átlagára vonatkozó hipotézisnek a tesztelésénél, amelynél egyetlen mintával dolgozunk, a szabadságfok értéke n-1."
A félreolvasásnak én kisebb valószínűséget adnék, mint a helyes leolvasásnak. Mondjuk ha számjegyenként 90% esélye van a helyes leolvasásnak, szerintem az még mindig elég kevés. De ha ennyit adunk, akkor 0,1*0,1*0,1=0,0001=0,1% a valószínűsége annak, hogy valaki három számjegyet is félreolvas. Ezt megteheti négyféleképpen (jól olvassa le vagy az elsőt, vagy a másodikat, vagy a harmadikat, vagy a negyediket). Hogy mindenki három számjegyet rosszul olvas le, 0,00000000001 valószínűségű. Ezt még el kell osztani 4*4-el, akkor megkapjuk, hogy mennyi az esélye annak, hogy ugyanazt a három számjegyet olvasták le rosszul (0,000000000625%). És akkor arról még nem is beszéltünk, hogy a félreolvasás ráadásul ugyanúgy történt.