稳准狠!新冠围城,数据辅助医院做出更佳选择

      最后更新:2020-05-15 11:32:53 手机定位技术交流文章

      全文由1467个单词组成,预计需要5分钟来学习。

      资料来源:unsplash

      人类应该如何应对新皇冠?在疫情爆发期间,快速、准确和有效的决策是首要任务。我不得不说,大数据这次帮了大忙。

      为了构建理解COVID-19多样性发展的综合模型,我将使用分析时间序列模型来评估新冠状病毒住院患者数量的增加。时间序列模型的共同要求是平滑,这是消除数据噪声的常用技术。

      在这种情况下,我们的目标是了解在数据噪声的基本条件下,新加冕的住院患者数量是否会稳步增加。

      首先,我们需要获得数据。我们将在疫情开始时使用2020年1月1日至2020年2月28日的计数数据。为什么是这个时候?我们希望在疫情爆发之初估计住院人数的增加,并在以后显示这些数据的重要性。

      数学阅读太无聊了。我将简要说明模拟计数数据的方法。我的目标是使用观察数据来模拟()和(T)是第T天新的冠状动脉肺炎住院人数。理想情况下,我们希望能够预测下一个第T天的住院人数。

      在广义线性模型中,我们可以用指数族的任何分布(称为势变量z)来建模,其平均值是线性函数t的可逆函数(随机变量代表t的可能值)。一旦在模型中指定了输出分布和连接函数,接下来我们需要找到最大似然估计参数β。在估计参数β后,我们可以用β来预测输入不同t时的值。

      跳过证明部分,我们找到了以下公式:

      到目前为止,这种模式似乎是可行的。直观地说,我们想要一个平均似然估计量z。我们假设Z的指数增长是可靠的(根据流行病学)。等式4是广义线性模型的导出链接函数、参数和输出分布。在这种情况下,输出分布符合泊松分布。

      现在让我们拟合模型,并在和z上有95%的置信区间。

      产出分布是泊松分布模型

      该模型具有不寻常的特点,模型增长率的置信区间值过高,且无法准确捕捉计数数据的可变性。这种现象主要是由于泊松分布的小方差,这被称为过度分散。

      为了解决这个问题,我们可以用一个新的输出分布(目前是泊松分布)来代替它,这可以用来解释过度分散。负二项分布也可用于对计数数据建模,同时允许比具有相同平均值的泊松分布更宽的方差。

      产出分布为负二项分布的模型

      即使在使用负二项分布来改进模型之后,我们也应该注意如何解释结果。这个模型能用来理解新加冕病人的住院率在未来将呈指数增长吗?解释结果时,应注意以下因素:

      1.增长较快的子群体的数量可能很快达到饱和,然后总住院人口的剩余增长将由增长较慢的其他子群体提供。

      2.新发病例(确诊病例、住院病例等)数据。)具有时间差(该时间差可以是随机的)。

      3.确诊的新病例数量可能会因漏报(大多数未接受检测的感染者)和检测能力的提高(接受检测的总人数增加)而受到影响。

      4.指数增长模型假设医院的容量是无限的,没有考虑居民数量的饱和和排除死亡人口。

      资料来源:unsplash

      尽管这两种模式都有局限性,但它们仍然具有启发性。虽然指数增长通常不能模拟传染病随时间的增长而爆发,但指数增长模型确实可以模拟爆发的初始阶段。

      如果我们能够在疫情爆发的初始阶段估计和限制住院治疗的潜在增长,我们就可以提前准备好设备,并估计医院的医疗需求。可以看出,在关键时刻,合理使用数据可以起到很大的作用,可以挽救无数的生命。

      评论、表扬和关注

      让我们分享人工智能学习和发展的干货。

      如果重印,请在后台留言并遵守重印规则。

      本文由 在线网速测试 整理编辑,转载请注明出处,原文链接:https://www.wangsu123.cn/news/6675.html

          热门文章

          文章分类