Öffnen Sie Ihr Projekt (über die «KW-Statistik-E-Projekt.Rproj»; oben rechts in R-Studio/Positron sollte das dann stehen).
Gehen Sie rechts (meistens unten) auf «Files» und klicken dort auf «Zweite-Analysen.qmd».
Arbeiten Sie sich durch die Datei und erledigen Sie die HA 1 bis HA 10.
Im Quarto-File «Zweie-Analysen.qmd» sind zwei Bilder eingebettet. Wer das Dokument rendern möchte, kann die Bilder, die dazu benötigt werden, hier herunterladen, dann entzippen und sie bei sich im Ordner «images», der im Ordner «KW-Statistik-E-Projekt.Rproj» liegt, speichern.
Ablauf etwa gleich wie letztes Mal:
~30 Minuten arbeitet ihr es allein oder in kleinen Gruppen noch einmal durch.
Anschliessend Besprechung im Plenum.
LEF 4
Offene Aufgaben
Beantwortet so kurz wie möglich und nur so ausführlich wie nötig die folgenden offenen Fragen.
Frage 4.1
Warum ist die Betrachtung von Streuung wichtig?
Frage 4.2
Warum kann ein geringer Mittelwert mit hoher Streuung auftreten?
Frage 4.3
Wann wäre der Interquartilsabstand nützlicher als die Standardabweichung?
Frage 4.5
Zählen Sie genau drei Streuungsmasse auf (drei Richtige und zwei Falsche geben einen Punkt!).
Frage 4.6
Wie ist Varianz für die Stichprobe definiert? (Tipp:Formelsammlung)
Frage 4.7
Was ist gemeint, wenn es heisst, dass die Standardabweichung, im Unterschied zur Varianz, formal dieselbe Skalierung wie die Variable hat?
Frage 4.8
Wie ist der Variationskoeffizient (VK) definiert?
Geschlossene Aufgaben
Kprim (MC)
Single-Choice (SC)
Text Replacement Task (TRT)
MC 4.1.
MC 4.1: Sind folgende Aussagen richtig oder falsch?
MC_4_1 = [ ["Streuungsmasse sind Masse der zentralen Tendenz","falsch"], ["Es gibt verschiedene Streuungsmasse für verschiedene Skalenniveaus.","richtig"], ["Streuungsmasse sind immer grösser als Lagemasse.","falsch"], ["Das wichtigste Streumass ist der IQR.","falsch"]]viewof answers_4_1 =quizInput({questions: MC_4_1,options: ["richtig","falsch"]})Punkte_4_1 = {const Sum = (answers_4_1[0] == MC_4_1[0][1])*1+ (answers_4_1[1] == MC_4_1[1][1])*1+ (answers_4_1[2] == MC_4_1[2][1])*1+ (answers_4_1[3] == MC_4_1[3][1])*1var Punkte_4_1 = Sum -2if (Punkte_4_1 <1) {Punkte_4_1 =0}return(Punkte_4_1)}
Punkte:
SC 4.2.
SC 4.2 Welches der folgenden Streumasse ist das beste um die Streuung in einer metrischen Variablen zu beschreiben?
MC 4.3: Sind folgende Aussagen richtig oder falsch?
MC_4_3 = [ ["Die Varianz einer Variablen ist immer grösser als ihre Standardabweichung (SD).","falsch"], ["Die Standardabweichung einer Variablen ist immer grösser als ihr Mittelwert.","falsch"], ["Die Varianz ist immer grösser als oder gleich dem MAD.","richtig"], ["Bei Dummyvariablen ist die Varianz immer kleiner oder gleich der SD. (schwer)","richtig"]]viewof answers_4_3 =quizInput({questions: MC_4_3,options: ["richtig","falsch"]})Punkte_4_3 = {const Sum = (answers_4_3[0] == MC_4_3[0][1])*1+ (answers_4_3[1] == MC_4_3[1][1])*1+ (answers_4_3[2] == MC_4_3[2][1])*1+ (answers_4_3[3] == MC_4_3[3][1])*1var Punkte_4_3 = Sum -2if (Punkte_4_3 <1) {Punkte_4_3 =0}return(Punkte_4_3)}
Punkte:
SC 4.4.
SC 4.4: Welche der folgenden Aussagen über die Varianz ist korrekt?
SC_4_4 = [ ["Sie ist immer kleiner als die Standardabweichung.","Sie hat dieselbe Einheit wie die ursprünglichen Daten.","Sie ist immer positiv.","Sie wird durch den Median berechnet.","Extremwerte werden nicht berücksichtigt."],2// Index der richtigen Antwort]viewof answer_SC_4_4 =singleChoiceInput({options: SC_4_4[0],correctIndex: SC_4_4[1]})Punkte_SC_4_4 = {const correctIndex = SC_4_4[1];return answer_SC_4_4 === correctIndex ?1:0;}
Punkte:
MC 4.4.
MC 4.4: Sind folgende Aussagen richtig oder falsch?
MC_4_5 = [ ["Die Spannweite ist dasselbe wie der Range einer Variablen.","richtig"], ["In R wird mit der Funktion range() das Maximum und das Minimum einer Variable rausgegeben.","richtig"], ["Der Interquartilsabstand ist robust gegenüber Ausreissern.","richtig"], ["Robust nennt man einen Kennwert, wenn er nicht vom Mittelwert beeinflusst wird.","falsch"]]viewof answers_4_5 =quizInput({questions: MC_4_5,options: ["richtig","falsch"]})Punkte_4_5 = {const Sum = (answers_4_5[0] == MC_4_5[0][1])*1+ (answers_4_5[1] == MC_4_5[1][1])*1+ (answers_4_5[2] == MC_4_5[2][1])*1+ (answers_4_5[3] == MC_4_5[3][1])*1var Punkte_4_5 = Sum -2if (Punkte_4_5 <1) {Punkte_4_5 =0}return(Punkte_4_5)}
Punkte:
MC 4.6.
MC 4.6: Sind folgende Aussagen richtig oder falsch?
MC_4_6 = [ ["Der MAD ist der verrückteste Kennwert der bivariaten Statistik.","falsch"], ["Der MAD ist unempfindlicher gegenüber Extremwerten als die SD.","richtig"], ["Der MAD wird in den Einheiten der Ursprungsvariable angegeben.","richtig"], ["Der MAD ist ein standardisiertes Mass.","falsch"]]viewof answers_4_6 =quizInput({questions: MC_4_6,options: ["richtig","falsch"]})Punkte_4_6 = {const Sum = (answers_4_6[0] == MC_4_6[0][1])*1+ (answers_4_6[1] == MC_4_6[1][1])*1+ (answers_4_6[2] == MC_4_6[2][1])*1+ (answers_4_6[3] == MC_4_6[3][1])*1var Punkte_4_6 = Sum -2if (Punkte_4_6 <1) {Punkte_4_6 =0}return(Punkte_4_6)}
Punkte:
MC 4.7.
MC 4.7: Sind folgende Aussagen richtig oder falsch?
\[ s^2 = \frac{1}{n}\sum (X_i - \bar{X})^2 \]
MC_4_7 = [ ["Die Formel gibt die Varianz für die GG wieder.","falsch"], ["Die Schätzung der Varianz für die GG ist immer grösser als die für die Stichprobe.","richtig"], ["Der Unterschied zwischen der Varianz der Stichprobe und GG wird mit steigendem n immer kleiner","richtig"], ["Würde man die Mittelwertdifferenzen nicht quadrieren, wäre die Summe immer 0.","richtig"]]viewof answers_4_7 =quizInput({questions: MC_4_7,options: ["richtig","falsch"]})Punkte_4_7 = {const Sum = (answers_4_7[0] == MC_4_7[0][1])*1+ (answers_4_7[1] == MC_4_7[1][1])*1+ (answers_4_7[2] == MC_4_7[2][1])*1+ (answers_4_7[3] == MC_4_7[3][1])*1var Punkte_4_7 = Sum -2if (Punkte_4_7 <1) {Punkte_4_7 =0}return(Punkte_4_7)}
Punkte:
TRT 4.8
TRT 4.8. Fügen Sie die Funktion ein, mit der der Mittelwert berechnet wird.