網路城邦

上一篇 回創作列表 下一篇   字體:
描述性統計
2011/03/03 21:20:03瀏覽609|回應0|推薦0

描述性統計030311

 

查資料過程

n        ICPSR

n        3103

n        search for data

n        study of prosecutir

n        from 1999 to 1999

n        united state 12 data

n        author

n        download

n        all files

n        e-mail

n        i agree

n        save

n        解壓縮

n        畫圖說明

 

類別資料和數值資料

       類別資料要分區表示來整理資料, 或是畫圖表示, 可以展現其相關關係, 予人有清楚概念, 各種圖表各有利弊

       數值資料整理, 先分組, 每組組距相同, 每個數值只被分派到一個組別, 盡量不要太多(>15), 也不要太少(<5).

 

直方圖和長條圖的區分?

資料勘誤, 運用散佈圖可以驗證

       比如年齡和年資分佈圖, 應該呈現正比關係,  若是53, 年資2, 表示有錯, 將所有資料LABEL, 查出CASE 269的問題何在. 是否輸錯還是有其他問題, 再做重新整理

 

資料轉換

n        重新編碼成不同變數

n        保留最原始資料檔比較安全

n        建立新變項, 要記錄其理論根據, 所以寫工作日誌有所必要, 便於查詢

n        記錄檔RECORD, 記錄了今天在spss 所做工作,

 

集中趨勢和分散趨勢

       集中---平均數, 中位數和眾數, 方便, 以一個數字就能表達,

       加權平均: 分數乘以學分, 每科加總除總學分, 等於加權平均; 每個觀查值的重要性不一樣時, 就必須採用加權平均

       中位數, 最中間的數, 若有偶數則取最中間兩數的平均

       眾數, 類別最多的數目, 不相鄰眾數出現, 叫做雙峰分配

 

使用時機

       平均分配時, 平均數可以代表

       有偏差時, 眾數或中位數較有代表性

 

分散趨勢

       離散量數代表個別差異有多大, 若離散量數小, 表示數值資料較集中,

全距最大值與最小的差

       四分位差---

       平均差---等於0

       變異數---各值減去平均數, 再平方, 平方根後成為標準差, 永為正數, 表示和平均值的距離, 等於0表示每個數值都和平均數一樣.

 

 

      

 

      

 

( 知識學習隨堂筆記 )

回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=wangkwo&aid=4942536