数介绍:
次分析数某公司474名职工状况统计表中包含十变量分:id(职工编号)gender(性)bdate(出生日期)edcu(受教育水程度)jobcat(职务等级)salbegin(起始工资)salary(现工资)jobtime(单位工作历<月>)prevexp(前工作历<月>)minority(民族类型)age(年龄)通运spss统计软件变量进行频数分析描述性统计方差分析相关分析解该公司职工述方面综合状况分析变量分布特点相互间关系
二 数分析
1 频数分析基统计分析频数分析开始通频数分析够解变量取值状况握数分布特征非常次分析利某公司474名职工基状况统计数表gender(性)edcu(受教育水程度)状况频数分析解该公司职工男女职工数量受教育状况基分布
Statistics
Gender
Educational Level (years)
N
Valid
474
474
Missing
0
0
首先该公司男女性分布进行频数分析结果:
Gender
Frequency
Percent
Valid Percent
Cumulative Percent
Valid
Female
216
456
456
456
Male
258
544
544
1000
Total
474
1000
1000
表说明该公司474名职工中216名女性258名男性男女例分456544该公司职工男女数量差距男性略女性
次原数中受教育程度进行频数分析结果表 :
Educational Level (years)
Frequency
Percent
Valid Percent
Cumulative Percent
Valid
8
53
112
112
112
12
190
401
401
513
14
6
13
13
525
15
116
245
245
770
16
59
124
124
895
17
11
23
23
918
18
9
19
19
937
19
27
57
57
994
20
2
4
4
998
21
1
2
2
1000
Total
474
1000
1000
表直方图说明调查474名职工中受12年教育职工该组频数高190占总数401次15年116占中数245接受高20年教育数1例低
2 描述统计分析通简单频数统计分析解职工性受教育水总体分布状况需数中变量特征更精确认识需通计算基描述统计方法实现面变量进行描述统计分析均值标准差片度峰度等数进步数集中趋势离散趋势
Descriptive Ststistics
N
Minimum
Maximum
Mean
Std Deviation
Skewness
Kurtosis
Statistic
Statistic
Statistic
Statistic
Statistic
Statistic
Std Error
Statistic
Std Error
Educational Level (years)
474
8
21
1349
2885
114
112
265
224
Current Salary
474
15750
135000
3441957
17075661
2125
112
5378
224
Beginning Salary
474
9000
79980
1701609
7870638
2853
112
12390
224
Previous Experience (months)
474
0
476
9586
104586
1510
112
1696
224
Months since Hire
474
63
98
8111
10061
053
112
1153
224
表示起始工资例读取分析结果474名职工起始工资值$9000 值$79980均起始工资$17016标准差$7870638偏度系数峰度系数分285312390数读取该表表明474名职工受教育水起始工资现工资先前工作验现工作验详细分布状况
3 Exploratory data analysis
(1) 交叉分析
通频数分析够掌握单变量数分布情况实际分析中仅解单变量分布特征分析变量取值分布掌握变量联合分布特征进分析变量间相互影响关系数言需解现工资性年龄受教育水起始工资单位工作历前工作历职务等级交叉分析现现工资职务等级列联表分析例读取数(面数分析表截取部分):
单素分析研究控制变量水否观测变量产生显著影响面受教育水起始工资作控制变量现工资观测变量通单素方差分析方法研究受教育水起始工资现工资影响进行分析分析结果:
表起始工资现工资单素方差分析结果出:F统计量观测值33040应概率P值似等0果显著性水005概率值P显著性水q应拒绝原假设认起始工资现工资产生显著影响
理表受教育水现工资影响单素分析结果结果拒绝原假设受教育水现工资产生显著影响
4 相关分析相关分析分析客观事物间关系数量分析法明确客观事物间
样关系理解运相关分析极重
函数关系指两事物间种应关系变量X取定值时变量函数Y根确定函数取定值种普遍存关系统计关系统计关系指两事物间种非应关系变量X取定值时变量Y法根确定函数取定值统计关系分线性关系非线性关系
事物间函数关系较容易分析测度事物间统计关系函数关系样直接确实普遍存关系强关系弱程度差异测度事物间统计关系强弱关注问题相关分析正种简单易行测度事物间统计关系效工具
表次分析数中现工资起始工资单位工作时间前工作时间年龄五变量间相关分析表中相关系数旁边两星号(**)表示显著性水001时拒绝原假设星号(*)表示显著性水005拒绝原假设先现工资变量变量相关性例分析表知现工资起始工资相关性相关系数0880单位工作时间相关性相关系数0084
5 参数检验
首先现工资分布做正态性检验结果:
图知现工资分布似作符合正态分布现推断现工资变量均值否30000采取单样t检验进行分析分析:
OneSample Statistics
N
Mean
Std Deviation
Std Error Mean
OneSample Test
Test Value 30000
t
df
Sig (2tailed)
Mean Difference
95 Confidence Interval of the Difference
Lower
Upper
Current Salary
5635
473
000
4419568
287840
596073
OneSample Statistics知474名职工现工资均值3441957标准差17075661均值标准误差784311图表OneSample Test中第二列t统计量观测值5635第三列度473(n1)第四列t统计量观测值双尾概率值第五列样均值检验值差第六列第七列总体均值原假设值差95置信区间(287840 596073)该问题t值等5635应界置信水0远远设置005拒绝原假设表明该公司474名职工现工资30000存显著差异
6 非参数检验数中年龄做正态分布检验结果:
图两图知474名职工年龄分布完全符合正态分布现推断职工年龄均数4045岁间采非参数检验方法进行检验检验结果:
ChiSquare Test
面第表卡方检验频率表输出关频率统计表中知职工年龄40岁41名期值235残差175余读取方式相第二表卡方检验统计表显示检验卡方值度渐进显著性水分2848950显著性水0005拒绝原假设474名职工均年龄4045岁间
文档香网(httpswwwxiangdangnet)户传
《香当网》用户分享的内容,不代表《香当网》观点或立场,请自行判断内容的真实性和可靠性!
该内容是文档的文本内容,更好的格式请下载文档