方法论的研究
随着公共卫生领域使用的数据量和复杂性迅速增加,需要在统计建模和计算方面采用更先进的方法。例如,高频数据的计算机密集型处理和分析需要有效的编程方法;贝叶斯统计在传染病建模和推断中越来越受欢迎;基于面向对象和拓扑数据分析的新型计算方法也被开发用于生物信号和网络分析。
在疾病制图中,由于空间和时间的接近,数据往往是相关的,而在社会和神经成像网络中,感兴趣的地点或区域通常具有较高的空间和时间相关性。多元统计为同时分析多个相互依赖的结果提供了强大的工具。
纵向数据包括在一段时间内对同一受试者或同一类(如家庭)的不同受试者重复收集的测量数据,这在许多公共卫生研究中非常常见,如队列数据和调查数据。
生存分析是专门为分析从时间到事件的数据(例如,到疾病发作的时间,到死亡的时间,治疗的时间等)而设计的,当由于失去随访或研究结束而部分未观察到结果时,生存分析在检查随着时间的推移的死亡风险方面是强大的。
丢失的数据是应该收集的数据,但由于某种原因,没有收集。这是一个统计问题,在社会、行为、流行病学和医学科学中非常常见,可能会在分析中引入偏差,并增加估计的不确定性。有限的依赖结果(如二元、计数、分类)、有限的结果(如临床评分、学业成绩)和循环结果(如蛋白质结构、昼夜节律、睡眠周期)需要特别的分析方法。
非参数和半参数方法放宽了通常限制参数模型适用性的建模假设。因此,非参数和半参数模型为发现复杂数据中的模式和关联提供了灵活的分析工具。
现代生物技术(如微阵列和下一代测序)要求开发强大而有效的统计方法,以便从公共卫生和生物医学研究产生的高通量遗传和基因组数据中得出推论。分析包括基于家族和群体的人类遗传/基因组数据,如单核苷酸多态性(SNP)、基因表达和蛋白质表达数据。
应用领域
该方法广泛应用于以下领域。
•传染病图谱
•疾病流行率预测
•疾病集群检测
基于面向对象和拓扑数据分析工具的新型统计框架正在开发用于脑卒中后失语症和癫痫的脑电图(EEG)、扩散和功能磁共振成像(dMRI和fMRI)数据,以更好地了解这些脑网络障碍中的神经缺陷
通过与南加州大学以及其他国家和国际机构的医学和科学研究人员合作,教师们正在开发遗传学/基因组学数据分析的程序,如微阵列分析、功能基因组学、下一代测序分析、组学数据的综合分析、表观遗传学和复杂的生物信息学方法(RNA-seq分析、途径分析和差异表达分析)。
用于身体活动和睡眠监测的加速度测量
NHANES,英国队列研究
SEER,南卡罗来纳州癌症登记处数据
来自SC-RFA办公室的数据
•ICD9/10代码