字體:小 中 大 | |
|
|
2011/03/03 21:20:03瀏覽609|回應0|推薦0 | |
描述性統計030311 查資料過程 n ICPSR n 3103 n search for data n study of prosecutir n from 1999 to 1999 n united state 12 data n author n download n all files n e-mail n i agree n save n 解壓縮 n 畫圖說明 類別資料和數值資料 類別資料要分區表示來整理資料, 或是畫圖表示, 可以展現其相關關係, 予人有清楚概念, 各種圖表各有利弊 數值資料整理, 先分組, 每組組距相同, 每個數值只被分派到一個組別, 盡量不要太多(>15), 也不要太少(<5)組. 直方圖和長條圖的區分? 資料勘誤, 運用散佈圖可以驗證 比如年齡和年資分佈圖, 應該呈現正比關係, 若是53歲, 年資2年, 表示有錯, 將所有資料LABEL, 查出CASE 269的問題何在. 是否輸錯還是有其他問題, 再做重新整理 資料轉換 n 重新編碼成不同變數 n 保留最原始資料檔比較安全 n 建立新變項, 要記錄其理論根據, 所以寫工作日誌有所必要, 便於查詢 n 記錄檔RECORD, 記錄了今天在spss 所做工作, 集中趨勢和分散趨勢 集中---平均數, 中位數和眾數, 方便, 以一個數字就能表達, 加權平均: 分數乘以學分, 每科加總除總學分, 等於加權平均; 每個觀查值的重要性不一樣時, 就必須採用加權平均 中位數, 最中間的數, 若有偶數則取最中間兩數的平均 眾數, 類別最多的數目, 不相鄰眾數出現, 叫做雙峰分配 使用時機 平均分配時, 平均數可以代表 有偏差時, 眾數或中位數較有代表性 分散趨勢 離散量數代表個別差異有多大, 若離散量數小, 表示數值資料較集中, 全距—最大值與最小的差 四分位差--- 平均差---等於0 變異數---各值減去平均數, 再平方, 平方根後成為標準差, 永為正數, 表示和平均值的距離, 等於0表示每個數值都和平均數一樣.
|
|
( 知識學習|隨堂筆記 ) |