独立的思考,成功能否有飞跃?
statistics
美国癌症流行现状(2010):4个数据
七 27th
CA Cancer J Clin. 2010 Jul 7; DOI: 10.3322/caac.20073
很期待咱们天朝的“有关部门”能拿得出且相应的数据出来,不过,,,这个真没有。本文的4个数据来自于美国癌症协会(ACS)公布的资料,发表在ACS主办的《CA: A Cancer Journal for Clinicians》杂志上,显示的是美国人口的年度癌症的发病率和死亡率资料。
这里罗列4个我感兴趣的数据,已经在twitter上投稿给了 @med_cn。了解更多数据,点击跳转后阅读免费全文。
总体看癌症
从1999年起,直到现在,癌症都超过了心脏病,成为了85岁以下的美国人最主要的死亡原因。而美国儿童和青壮年(1~39岁)的主要死因则是意外事故,自杀和谋杀加起来占第二。
前5位的死因
美国男性的前5位癌症死亡原因为:肺癌、前列腺癌、大肠癌、胰腺癌和肝癌;女性:肺癌、乳腺癌、大肠癌、胰腺癌和卵巢癌。
最高发的5种癌症
美国男性最高发的5种癌症是:前列腺癌、肺癌、大肠癌和黑色素瘤;女性为:乳腺癌、肺癌、大肠癌、子宫内膜癌和甲状腺癌。
趋势
相比较1990s,在美国,只有肝癌的死亡率在男性和女性都发生了上升,此外男性的食管癌和黑色素瘤,女性的肺癌和胰腺癌死亡率也发生了上升。
OR值的计算方法
九 25th
OR值的意义可以参考新浪网友“统计遗传”的这篇日志。这里做一些摘抄和修改:
OR值的全称是odds ratio、比值比,对于发病率很低的疾病来说,它是OR值即是相对危险度的精确估计值。OR值的意义:
OR值等于1,表示该因素对疾病的发生不起作用;
OR值大于1,表示该因素是危险因素;
OR值小于1,表示该因素是保护因素。
计算公式如下:假定我们要鉴别因素(例如吸烟)是不是某个疾病的危险因素(例如肺癌)。形成如下四个表:

OR值= AD/BC。95%的置信区间就不用公式了,下面用SPSS实现。
SPSS不支持4格表,需要原始的阴性和阳性的数据,即,形式如下(一般情况下,1-是,0-否)。

使用卡方检验,计算P值,同时可以计算OR值。SPSS里计算OR值的具体方法:
菜单Analyze – Descriptive Statistics – Crosstabs,在弹出的Crosstabs里,Row和Column的框里分别添加吸烟和肺癌两个变量(行列可以相互交换,不影响OR的计算结果)。点击Statistics按钮,弹出对话框,勾选Chi-square和Risk,然后Continue。其他不用管,按下OK按钮进行运算。结果里产生了3个表格:
第1个是数据是否确实等情况和4格表。
第2个可以看到第1行卡方值和检验的P值。根据注释b,看有几个cell(四格表的格子)的预测值小于5,如果有1个(25%)及以上的cell的预测值小于5,则需要看Fisher’s Exact Test一栏的P值,否则就是第1行的卡方检验P值就可以了。
第3个表格的第1行就是OR值了,可以看到OR值和95%CI。