跳转到内容

大数据拯救

UofSC的研究人员处理大量的数据来解决现实世界的问题



陆军直升机上的传感器收集齿轮和轴承日常磨损的关键信息,为故障前更换部件提供节省成本和拯救生命的指南。

在南卡罗来纳州的一块农田里,仪器持续追踪湿度、温度和降水量等数据点,使研究人员能够模拟即将收获的玉米作物上积累的致命黄曲霉毒素真菌的数量。

在全州范围内,不同项目的医疗保健研究人员正在研究患者数据,以提高艾滋病毒医疗护理的利用率,减少医院再入院的频率。

南卡罗来纳大学的科学家们正在进行的每一个项目都有一条金线——复杂数据分析。bob官方体育登陆在每一种情况下,南加州大学的研究人员都在寻找从庞大的数据集中提取有用信息的方法,然后将其应用于产生非凡影响的方式。

近年来,复杂数据研究势头迅猛,南加州大学不仅成为数据分析教育和培训的主要参与者,而且还成为学生的数据分析教育和培训的来源。

“我认为,每个人都需要能够进行数据分析,从STEM领域到经济学,”计算机科学与工程系教授约翰·罗斯(John Rose)说,他教授了两学期的这门课程。“我是数据分析的布道者。”


“我能预测你要做什么……”

如果说罗斯是大数据分析的传道者,那么班基·奥拉托西(Banky Olatosi)就是其中之一。奥拉托西是阿诺德公共卫生学院卫生服务政策与管理系的临床副教授,他认为这是解决医疗保健面临的一些重大挑战的一种方法。

奥拉托西说:“过去几年,大数据分析一直是我的爱好。“如果你仔细想想,这就是谷歌和亚马逊已经在使用的东西。事实证明,如果我得到正确的数据,我就能洞察人类行为。一旦我了解了这种行为,我就能在你知道你要做什么之前预测你要做什么。”

这听起来可能有点吓人,但奥拉托西和阿诺德学院的健康促进、行为和教育教授李晓明希望,预测分析可以帮助解决南卡罗来纳州艾滋病毒阳性人群的医疗保健需求。他们在合作一个项目收集该人群的匿名数据,使用复杂的算法来预测艾滋病毒阳性客户何时可能退出医疗保健。让这些人继续接受常规医疗护理意味着患者的健康状况会更好,并降低病毒传播给他人的风险。

朗达休斯

护理学教授隆达·休斯(Ronda Hughes)希望使用数据分析来帮助棕榈健康中心(Palmetto Health)的工作人员采取更加分析驱动的方法来护理患者。这种基于数据的决策可以提供更好的护理,帮助患者避免不必要和昂贵的住院治疗。

在另一个项目中,护理学教授、护理领导力中心主任隆达·休斯(Ronda Hughes)正在与南卡罗来纳州领先的医疗保健提供商之一棕榈健康(Palmetto Health)合作,帮助改变实践,以帮助降低出院后30天内再次住院的患者数量。这些再入院通常发生在老年患者或有很多医疗需求的患者身上,医院会受到医疗保险和医疗补助当局的高额罚款,有时总计达数百万美元。

休斯的项目旨在改进协议,使患者可以避免在出院后很快使用医院服务,帮助患者避免不必要和昂贵的急性护理,并减少在此过程中昂贵的医院处罚。

休斯说:“我们希望在护理患者时做出更多的数据决策,而不仅仅是经验之谈。”“当患者患有多种慢性疾病时,数据分析可以帮你了解哪些方案和干预措施是最好的治疗方案。”

休斯的项目涉及南加州大学工程、公共卫生、商业和药学领域的教师,并利用电子健康记录、州和社区数据库甚至国家数据的数据。

“目前很多临床协议基本上都是检查清单,包括所有临床医生都使用的一些诊断算法。我们试图做的是创造复杂的预测分析驱动解决方案,这是你无法在头脑中完成的——接近人工智能。”

直升机维修

阿帕奇直升机上的传感器测量关键信息,通知机组人员何时更换飞机传动系统上的关键部件。机械工程教授Abdel Bayoumi的研究团队开发的复杂数据分析为美国陆军节省了数百万美元,可能还挽救了许多人的生命。

“就像搅拌蛋糕一样……”

当机械工程教授Abdel Bayoumi和他的团队在1998年开始对军用直升机维修进行成本效益分析时,很明显,他们收集的振动和温度的tb数据——如果正确解释的话——可以解决实际问题。20年后,现在隶属于麦克奈尔航空航天创新与研究中心的预测性维护中心,为美国陆军节省了数百万美元的直升机维护成本,并可能在这一过程中挽救了生命。

“举个例子,通过数据分析,我们发现阿帕奇直升机尾桨变速箱的一个部件存在设计缺陷,”巴尤米说。“制造部件的公司花了几个月的时间才承认设计存在问题,但当他们重新设计时,他们邀请我们参与这个过程。解决这一问题每年为阿帕奇直升机机队节省了5200万美元。”

巴尤米的团队从各个领域收集数据,从测量振动和温度的传感器到以维护记录和实际驾驶直升机的机组人员的技术手册形式的人工输入。巴尤米说:“这样你就能得到一个很好的数据组合,就像混合蛋糕一样。”“然后,我们开发算法来描述问题的根本原因,这可能是轴承或其他部件的过早失效。”

Bayoumi的团队正在利用其在直升机传感器分析方面的专业知识与赛峰工程服务公司合作,赛峰工程服务公司的广泛航空航天服务包括制造飞机线束。他们还利用大数据技术与埃及一所大学合作,设计并建造了一个巨大的水泵,将红海的水输送到海水淡化厂。他的团队将负责创建一个数字“双胞胎”,使泵成为一个智能的决策系统。

结合他们自己创建的算法和模型,预测性维护中心正在利用西门子公司去年捐赠给该大学的软件宝库,巴尤米认为这将有助于埃及水泵的研究。该中心已有20年的直升机研究历史,现在有了新的架构,研究人员很快就能将数据分析应用于整个直升机机身,而不仅仅是传动系统。

研究人员在玉米地里收集数据

在农田中设置的数据收集设备可以为美国和其他国家的玉米作物提供更安全的方法。计算机科学教员Gabriel Terejanu(跪在照片中)正致力于开发一个模型,该模型通过处理田地条件数据来预测黄曲霉毒素的风险水平,黄曲霉毒素是一种危及生命的真菌,影响着世界各地的玉米作物。


“你必须收集大量的数据”

这几乎是无法观察到的,但这并不影响黄曲霉毒素的致命影响。黄曲霉毒素是一种生长在玉米上的真菌,它会致癌,甚至是致命的。儿童饮用食用黄曲霉毒素感染玉米的奶牛所产的牛奶会影响其生长发育。这就是美国农业部密切关注全国黄曲霉毒素水平的原因。

计算机科学与工程副教授Gabriel Terejanu说:“你必须从包括湿度和温度在内的环境条件中收集大量数据,以建立一个模型来预测哪些田地或田地的哪些部分处于危险之中。”“问题是可变性非常大。当你收获玉米时,受黄曲霉毒素影响的玉米粒可能会被送到卡车上的某个地方,而不是被采样。”

Terejanu正在与阿诺德公共卫生学院的研究人员Buz Kloot和Anindya Chanda合作,在南卡罗来纳州的农田中部署数据收集仪器,以创建预测模型。“我们有一个模型,但到目前为止,我们对验证并不满意,”他说。“我希望有更多的实地测量——作物保险索赔,诸如此类——来验证我们的模型。”

一旦建立了有效的预测模型,农民就可以用它来决定收获作物的最佳时间,谷物升降机公司就可以知道从某些农场运来的哪些货物需要过度采样以检查真菌。监管机构将知道在哪里部署更多的检查人员。这种模型可以应用于世界任何地方。

Terejanu说,黄曲霉毒素在非洲某些地区的问题尤其严重,这些地区的粮食没有正确地储存在低湿度的筒仓中。他和昌达已经向盖茨基金会提交了一份关于黄曲霉毒素建模项目的资助提案。Terejanu说:“几年前,肯尼亚有几百人因为接触黄曲霉毒素而死亡。”“一个准确的预测模型可以帮助防止这种情况。”

培养下一代

正如南加州大学的这个项目样本所表明的那样,数据分析的应用范围非常广泛。约翰·罗斯的“大数据分析”课程不仅吸引了MBA和统计学专业的学生(你可能会期望的专业类型),还吸引了STEM学科甚至体育管理专业的学生。“每个人都看过《金钱球》,”罗斯打趣道。

课程的两个部分很快就被填满了,它们是一套四门课程的一部分,其中包括数据可视化,大数据分析的另一个组成部分。文理学院统计系与计算机科学与工程系合作开发的数据科学辅修现已开设,这两个单位正在研究证书和本科双专业。bob客户端下载地址此外,达拉摩尔商学院(Darla Moore School of Business)还为研究生和本科生提供数据分析证书。

所有人都在猜测大数据研究将走多远,但罗斯指出,深度学习就是一个明显的例子。复杂的数据集加上计算机和实时传感器已经使自动驾驶汽车成为现实。

“现在我们有了处理所有这些数据的计算基础设施,”他说。“只是因为你有一把锤子,并不是所有的东西都是钉子。有时我们必须确切地知道该使用什么工具,这就是我们教给学生的东西。”

©
Baidu