拓端tecdat|R语言代写基于copula的贝叶斯分层混合模型的诊断准确性研究

   2023-03-08 学习力0
核心提示:原文链接:http://tecdat.cn/?p=3060 在对诊断测试准确性的系统评价中,统计分析部分旨在估计测试的平均(跨研究)敏感性和特异性及其变异性以及其他测量。灵敏度和特异性之间往往存在负相关,这表明需要相关数据模型。由于用户,分析在统计上具有挑战性处理

原文链接:http://tecdat.cn/?p=3060

 

在对诊断测试准确性的系统评价中,统计分析部分旨在估计测试的平均(跨研究)敏感性和特异性及其变异性以及其他测量。灵敏度和特异性之间往往存在负相关,这表明需要相关数据模型。由于用户,分析在统计上具有挑战性

  • 处理两个摘要统计,

  • 必须考虑敏感性和特异性之间的相关性,

  • 必须考虑到研究中的敏感性和特异性的异质性

  • 应该允许纳入协变量。

 

 本教程介绍并演示了用于诊断准确性研究的荟萃分析的分层混合模型。在层次结构的第一级中,给定每个研究的灵敏度和特异性,两个二项分布用于分别描述患病和健康个体中真阳性和真阳性样本数的变化。在第二级,我们使用二元分布模拟未观察到的敏感性和特异性。虽然使用了分层模型,但meta分析的重点在于研究中的汇总平均值,而在给定的研究估算中很少。

使用来自两个先前发布的meta分析的数据集来演示这些方法:

  • 尿液中端粒酶的诊断准确性作为诊断原发性膀胱癌的肿瘤标志物,因为它是一个有问题的数据集,其相关参数估计为-1并且没有协变量而引起收敛问题(Glas et al.2003) 

  • 比较病毒检测(使用HC2检测)的敏感性和特异性与重复细胞学检查对具有宫颈病变的女性进行分类,以检测潜在的宫颈癌前病变(Arbyn等,2013)。第二个数据集用于证明具有一个协变量的元回归,该协变量可以自然地扩展到包括几个协变量。

 

荟萃Meta 分析的统计方法

 

推理框架和软件

由于其灵活性和MCMC模拟的使用,复杂建模通常可以在贝叶斯框架内更容易地实现。通过控制先验分布,贝叶斯推断可以规避可识别性问题,而没有先验分布的频率推理中的数值逼近算法可能会因识别性问题而陷入困境。然而,贝叶斯方法通常需要统计专业知识和耐心,因为MCMC模拟是计算密集型的。相反,最频繁的方法已被包含在标准“程序”中,这些程序需要较少的统计知识和编程技能。此外,频率论方法通过最大似然估计(MLE)进行优化,与MCMC模拟相比,其具有更短的运行时间。  

 JAGS (Plummer等人2003)是Stan的另一种可扩展的通用采样引擎。扩展JAGS需要知道C++动态链接库(DLL)模块。根据经验,配置和构建模块是一项艰巨而繁琐的任务,尤其是在Windows操作系统中。上述缺点加上这样的事实,Stan即使从较差的初始值开始,往往会以较少的迭代收敛。 

 

模型诊断

为了评估链的模型收敛和平稳性,有必要检查潜在的比例缩减因子,有效样本大小(ESS),MCMC误差和参数的跟踪图。当所有链达到目标后验分布时,估计后验方差接近于链方差,使得两者的比率接近1,表明链是稳定,可能已达到目标分布。有效的样本大小表示实际上有关某个参数的信息量。当样本自动相关时,期望参数后验分布的信息少于样本独立时的信息。由于模拟了后验分布,因此近似值有可能偏离一定量;MCMC误差接近0表示可能已达到目标分布。

 

模型比较和选择

Watanabe-Alkaike信息准则(WAIC)(Watanabe 2010)是一种最近的模型比较工具,用于测量拟合模型在贝叶斯框架中的预测精度,用于比较模型。WAIC可以被视为对Deviance Information Criterion(DIC)的改进,尽管流行,但它已经存在一些问题(Plummer 2008)。WAIC是一个完全贝叶斯工具,非常接近贝叶斯交叉验证,对重新参数化不变,可用于简单以及分层和混合模型。

 

数据集

端粒酶数据

(Glas等,2003)系统地回顾了细胞学和其他标志物(包括端粒酶)对膀胱癌初步诊断的敏感性和特异性。他们报告说,端粒酶有敏感性和特异性分别为0.75 ,和0.86。他们得出结论,端粒酶不够灵敏,不宜用于日常使用。

将数据加载到R环境中并生成以下输出
  1.  
    ## ID TP TN FN FP
  2.  
    ## 1 1 25 25 8 1
  3.  
    ## 2 2 17 11 4 3
  4.  
    ## 3 3 88 31 16 16
  5.  
    ## 4 4 16 80 10 3
  6.  
    ## 5 5 40 137 17 1
  7.  
    ## 6 6 38 24 9 6
  8.  
    ## 7 7 23 12 19 0
  9.  
    ## 8 8 27 18 6 2
  10.  
    ## 9 9 14 29 3 3
  11.  
    ## 10 10 37 7 7 22

ID是研究的标识符,DIS是患病的数量,TP是真阳性NonDis的数量,是健康TN的数量,是真阴性的数量。

 

ASCUS分类数据

(Arbyn等人,2013年)对人乳头瘤病毒检测的准确性进行了Cochrane评价,并重复细胞学分析,对宫颈涂片进行检查以诊断宫颈癌前病变。他们SAS使用BRMA模型进行METADAS了10项研究,其中使用了两种测试。他们用于HC2和重复细胞学的绝对灵敏度分别为0.909 [0.857, 0.944]0.715 [0.629, 0.788]。这些数据用于演示如何在回归设置中扩展截距模型。将数据加载到R环境中并生成以下输出

  1.  
     
  2.  
    ## Test StudyID TP FP TN FN
  3.  
    ## 1 RepC Andersson 2005 6 14 28 4
  4.  
    ## 2 RepC Bergeron 2000 8 28 71 4
  5.  
    ## 3 RepC Del Mistro 2010 20 191 483 7
  6.  
    ## 4 RepC Kulasingam 2002 20 74 170 6
  7.  
    ## 5 RepC Lytwyn 2000 4 20 26 2
  8.  
    ## 6 RepC Manos 1999 48 324 570 15
  9.  
    ## 7 RepC Monsonego 2008 10 18 168 15
  10.  
    ## 8 RepC Morin 2001 14 126 214 5
  11.  
    ## 9 RepC Silverloo 2009 24 43 105 10
  12.  
    ## 10 RepC Solomon 2001 227 1132 914 40
  13.  
    ## 11 HC2 Andersson 2005 6 17 25 4
  14.  
    ## 12 HC2 Bergeron 2000 10 38 61 2
  15.  
    ## 13 HC2 Del Mistro 2010 27 154 566 2
  16.  
    ## 14 HC2 Kulasingam 2002 23 115 129 3
  17.  
    ## 15 HC2 Lytwyn 2000 4 19 33 1
  18.  
    ## 16 HC2 Manos 1999 58 326 582 7
  19.  
    ## 17 HC2 Monsonego 2008 22 110 72 2
  20.  
    ## 18 HC2 Morin 2001 17 88 253 2
  21.  
    ## 19 HC2 Silverloo 2009 34 65 81 2
  22.  
    ## 20 HC2 Solomon 2001 256 1050 984 11

Test是一个解释变量,显示分类测试的类型,StudyID是研究标识符,TP是真阳性数量,TN是真阴性的数量,FN是假阴性的数量。


 

截距模型

 

默认情况下,chains = 3 cores = 3。从上面的代码中,从每个3链中抽取1000样本,丢弃第一个样本,然后使得每个链具有900个“预烧期”后抽取。种子值seed = 3指定随机数生成器以允许结果的再现性,cores = 3允许通过使用3核来并行处理链,每个链一个核。

下面的迹线图显示了链和收敛。

拓端tecdat|R语言代写基于copula的贝叶斯分层混合模型的诊断准确性研究

接下来,获得如下的模型概要估计

  1.  
     
  2.  
    ## 95%置信区间的后验边缘平均值和中位数敏感性和特异性
  3.  
    ## Parameter Mean Lower Median Upper n_eff Rhat
  4.  
    ## MUse[1] Sensitivity 0.756762 6.904e-01 0.756036 0.81658 1196.9 1.001
  5.  
    ## MUsp[1] Specificity 0.798289 6.171e-01 0.813517 0.90640 704.4 1.004
  6.  
    ## ktau[1] Correlation -0.820176 -9.861e-01 -0.876343 -0.33334 269.2 1.015
  7.  
    ## Varse[1] Var(Sens) 0.006198 8.321e-06 0.005047 0.01947 165.7 1.007
  8.  
    ## Varsp[1] Var(Spec) 0.048111 1.357e-02 0.041060 0.12204 169.5 1.007
  9.  
    ##
  10.  
    ##
  11.  
    ## 模型特征
  12.  
    ##
  13.  
    ## Copula function: gauss, sampling algorithm: NUTS(diag_e)
  14.  
    ##
  15.  
    ## Formula(1): MUse ~ 1
  16.  
    ## Formula(2): MUsp ~ 1
  17.  
    ## Formula(3): Omega ~ 1
  18.  
    ## 3 chain(s)each with iter=28000; warm-up=1000; thin=30.
  19.  
    ## post-warmup draws per chain=900;total post-warmup draws=2700.
  20.  
    #### 模型的预测准确性
  21.  
    ##
  22.  
    ## Log point-wise predictive density (LPPD): -38.0607
  23.  
    ## Effective number of parameters: 7.5807
  24.  
    ## Watanabe-Akaike information Criterion (WAIC): 91.2828

从上面的输出,所述元分析灵敏度MUse[1]和特异性MUsp[1]0.7568 [0.6904, 0.8166]0.7983 [0.6171, 0.9064]。灵敏度和特异性分别为0.0062 [0, 0.0195]0.0048 [0.0136, 0.1220]。Kendall在敏感性和特异性之间的tau相关性估计为-0.8202 [-0.9861, -0.3333]

以下命令生成一系列森林图。

 

## $G1

拓端tecdat|R语言代写基于copula的贝叶斯分层混合模型的诊断准确性研究

  1.  
     
  2.  
    ##
  3.  
    ## $G2

拓端tecdat|R语言代写基于copula的贝叶斯分层混合模型的诊断准确性研究

  1.  
     
  2.  
    ##
  3.  
    ## $G3
  4.  
    ## Warning: Removed 2 rows containing missing values (geom_errorbar).

拓端tecdat|R语言代写基于copula的贝叶斯分层混合模型的诊断准确性研究

$G1是研究特异性敏感性和特异性(品红色点)及其相应的95%置信区间(黑线)的图。$G2是后验研究敏感性和特异性及其相应的95%置信区间(黑线)的图。

$G3是后验研究敏感性和特异性及其相应的95%置信区间(黑线)的图。还给出了研究特异性的灵敏度和特异性(品红点)及其相应的95%置信区间(粗灰线)。

如上图所示,总体平均敏感性和特异性存在“收缩”:后验研究的估计取决于全局估计,因此也取决于所有其他研究。

接下来,通过创建如下列表来准备数据

data块中,指定了数据集中变量的维度和名称,此处Ns指数据集中的研究数量。该parameters块引入了待估计的未知参数。etarho; 表示Fisher氏变换的关联参数的形式的标量,mul表示的灵敏度和特异性在对数下的平均值为中心的观察值,其中随机效应是矢量零。

transformed parameters块中进一步转换参数。在model块中定义所有参数和数据似然的先验分布。最后,在generated quantities块中,loglik是计算WAIC所需的对数似然向量。

接下来,stan调用函数将代码转换为C++,编译代码并从后验分布中提取样本,如下所示提取参数估计,并使用以下代码进一步检查链收敛和自相关

  1.  
     
  2.  
    ## Inference for Stan model: 61572683b29d52354783115614fab729.
  3.  
    ## 3 chains, each with iter=5000; warmup=1000; thin=10;
  4.  
    ## post-warmup draws per chain=400, total post-warmup draws=1200.
  5.  
    ##
  6.  
    ## mean se_mean sd 2.5% 50% 97.5% n_eff Rhat
  7.  
    ## MU[1] 0.7525 0.0018 0.0517 0.6323 0.7562 0.8415 796 0.9999
  8.  
    ## MU[2] 0.7908 0.0034 0.1095 0.5273 0.8094 0.9539 1045 1.0008
  9.  
    ## mu[1] 0.7668 0.0013 0.0388 0.6869 0.7688 0.8369 891 0.9990
  10.  
    ## mu[2] 0.8937 0.0027 0.0753 0.6943 0.9115 0.9825 789 0.9992
  11.  
    ## rho -0.9311 0.0070 0.1353 -0.9996 -0.9813 -0.5626 372 1.0077
  12.  
    ## Sigma[1,1] 0.3376 0.0091 0.2918 0.0579 0.2554 0.9851 1026 1.0023
  13.  
    ## Sigma[1,2] -1.2291 0.0272 0.8765 -3.4195 -1.0031 -0.2724 1040 0.9991
  14.  
    ## Sigma[2,1] -1.2291 0.0272 0.8765 -3.4195 -1.0031 -0.2724 1040 0.9991
  15.  
    ## Sigma[2,2] 5.6827 0.1282 4.1931 1.4720 4.6330 16.9031 1070 1.0002
  16.  
    ##
  17.  
    ## Samples were drawn using NUTS(diag_e) at Mon Oct 09 09:19:55 2017.
  18.  
    ## For each parameter, n_eff is a crude measure of effective sample size,
  19.  
    ## and Rhat is the potential scale reduction factor on split chains (at
  20.  
    ## convergence, Rhat=1).

所述元分析灵敏度(MU[1])和特异性(MU[2])和95%置信区间是0.7525[0.6323, 0.8415]0.7908[0.5273, 0.9539]。这与作者以两种方式发表的文章(0.75 [0.66,0.74]和0.86 [0.71,0.94])不同。作者将标准双变量正态分布拟合到logit转换的敏感性和特异性值,在研究中允许研究之间的异质性,并忽略了更高层次的分层模型。因此,作者必须使用0.5的连续性校正,这是分层模型中没有遇到的问题。

下图显示除了Clayton copula模型之外,大多数拟合模型的链条混合效果令人满意,几乎没有自相关。

拓端tecdat|R语言代写基于copula的贝叶斯分层混合模型的诊断准确性研究

所有拟合分布估计的平均灵敏度和特异性如下表所示。

  1.  
     
  2.  
    ## Warning: 6 (30.0%) p_waic estimates greater than 0.4.
  3.  
    ## We recommend trying loo() instead.
  4.  
    ## Model Parameter Mean Lower Median Upper n_eff
  5.  
    ## 1 Gaussian Sensitivity 0.756762 6.904e-01 0.756036 8.166e-01 1196.857
  6.  
    ## 2 Gaussian Specificity 0.798289 6.171e-01 0.813517 9.064e-01 704.379
  7.  
    ## 3 Gaussian Correlation -0.820176 -9.861e-01 -0.876343 -3.333e-01 269.179
  8.  
    ## 4 Gaussian Var(Sens) 0.006198 8.321e-06 0.005047 1.947e-02 165.705
  9.  
    ## 5 Gaussian Var(Spec) 0.048111 1.357e-02 0.041060 1.220e-01 169.508
  10.  
    ## 6 C90 Sensitivity 0.751379 6.913e-01 0.753546 8.098e-01 25.638
  11.  
    ## 7 C90 Specificity 0.807051 6.549e-01 0.821119 9.069e-01 119.897
  12.  
    ## 8 C90 Correlation -0.528340 -9.766e-01 -0.725178 -4.020e-18 4.111
  13.  
    ## 9 C90 Var(Sens) 0.004885 3.400e-04 0.003297 1.955e-02 11.615
  14.  
    ## 10 C90 Var(Spec) 0.045694 1.556e-02 0.038049 1.020e-01 137.149
  15.  
    ## 11 C270 Sensitivity 0.757528 6.877e-01 0.761163 8.210e-01 273.236
  16.  
    ## 12 C270 Specificity 0.803502 6.328e-01 0.811740 9.097e-01 1081.987
  17.  
    ## 13 C270 Correlation -0.697493 -9.827e-01 -0.808717 -3.332e-06 40.012
  18.  
    ## 14 C270 Var(Sens) 0.006662 2.667e-04 0.005293 2.027e-02 556.055
  19.  
    ## 15 C270 Var(Spec) 0.044767 1.268e-02 0.037922 1.112e-01 1098.815
  20.  
    ## 16 FGM Sensitivity 0.759407 6.891e-01 0.761931 8.174e-01 2475.208
  21.  
    ## 17 FGM Specificity 0.802588 6.453e-01 0.812498 9.045e-01 2293.332
  22.  
    ## 18 FGM Correlation -0.174538 -2.222e-01 -0.222221 2.222e-01 785.016
  23.  
    ## 19 FGM Var(Sens) 0.005390 7.425e-07 0.004181 1.813e-02 1019.633
  24.  
    ## 20 FGM Var(Spec) 0.041890 1.177e-02 0.036671 9.997e-02 2479.371
  25.  
    ## 21 Frank Sensitivity 0.756683 6.855e-01 0.758340 8.152e-01 2686.631
  26.  
    ## 22 Frank Specificity 0.808239 6.472e-01 0.818777 9.110e-01 1910.561
  27.  
    ## 23 Frank Correlation -0.706819 -8.550e-01 -0.692019 1.000e+00 2700.000
  28.  
    ## 24 Frank Var(Sens) 0.006678 5.896e-04 0.005280 2.140e-02 2699.766
  29.  
    ## 25 Frank Var(Spec) 0.042067 1.201e-02 0.035908 1.039e-01 1937.653
  30.  
    ## 26 BRMA Sensitivity 0.752531 6.323e-01 0.756181 8.415e-01 796.037
  31.  
    ## 27 BRMA Specificity 0.790796 5.273e-01 0.809420 9.539e-01 1044.902
  32.  
    ## 28 BRMA Correlation -0.822353 -9.824e-01 -0.876654 -3.804e-01 238.268
  33.  
    ## 29 BRMA Var(lSens) 0.337556 5.792e-02 0.255387 9.851e-01 1025.609
  34.  
    ## 30 BRMA Var(lSpec) 5.682692 1.472e+00 4.632967 1.690e+01 1070.481
  35.  
    ## Rhat WAIC
  36.  
    ## 1 1.0014 91.28
  37.  
    ## 2 1.0044 91.28
  38.  
    ## 3 1.0154 91.28
  39.  
    ## 4 1.0072 91.28
  40.  
    ## 5 1.0069 91.28
  41.  
    ## 6 1.1047 91.40
  42.  
    ## 7 1.0304 91.40
  43.  
    ## 8 1.3707 91.40
  44.  
    ## 9 1.1005 91.40
  45.  
    ## 10 1.0311 91.40
  46.  
    ## 11 1.0096 90.75
  47.  
    ## 12 1.0001 90.75
  48.  
    ## 13 1.0407 90.75
  49.  
    ## 14 1.0024 90.75
  50.  
    ## 15 0.9999 90.75
  51.  
    ## 16 0.9998 97.37
  52.  
    ## 17 0.9996 97.37
  53.  
    ## 18 1.0070 97.37
  54.  
    ## 19 1.0034 97.37
  55.  
    ## 20 0.9999 97.37
  56.  
    ## 21 0.9994 90.55
  57.  
    ## 22 0.9997 90.55
  58.  
    ## 23 NaN 90.55
  59.  
    ## 24 0.9990 90.55
  60.  
    ## 25 0.9992 90.55
  61.  
    ## 26 0.9999 86.76
  62.  
    ## 27 1.0008 86.76
  63.  
    ## 28 1.0218 86.76
  64.  
    ## 29 1.0023 86.76
  65.  
    ## 30 1.0002 86.76

结果以图形方式呈现如下

拓端tecdat|R语言代写基于copula的贝叶斯分层混合模型的诊断准确性研究

模型比较

上面显示,BRMA模型和高斯copula双变量β估计的相关性更加极端。另一个极端是模型FGM copula双变量β的估计,这是由于FGM copula中关联参数的约束,其中值在| 2/9 |内。

在上图中g1,尽管相关结构存在差异,但五个双变量β分布的边际平均灵敏度和特异性与95%置信区间的细微差异相当。

在没有估计困难的情况下,上表显示了Pearson估计的相关性-0.8224[-0.9824, -0.3804]。这是因为贝叶斯方法不受样本量的影响,因此能够处理具有较少问题的小样本量的情况。

基本上,所有六个模型在第一级层次结构中是等价的,并且在指定“研究特异性”敏感性和特异性的先验分布不同。因此,模型应具有相同数量的参数,在这种情况下,比较预测密度是有意义的。在检查时,来自五个基于copula的模型的对数预测密度实际上是等效的(min=-38.77, max=-37.89)但是参数的有效数量有点不同(min=7.25, max=9.92)。

Meta回归

ascus数据集有Test作为协变量。使用协变量是有意义的,以研究其对敏感性和特异性(包括相关性)的联合分布的影响。以下将基于copula的二元beta二项分布拟合到ascus数据。

 下图显示了适用于ascus数据的所有六个模型的迹线图,其中所有参数(包括相关参数(BRMA除外))都被建模为协变量的函数。除了基于Clayton copula的双变量β的情况外,存在适当的链混合和收敛。

拓端tecdat|R语言代写基于copula的贝叶斯分层混合模型的诊断准确性研究

从基于copula的双变量β分布来看,很明显HC2和重复细胞学中的敏感性和特异性之间的相关性是不同的。

  1.  
     
  2.  
    ## Warning: 19 (47.5%) p_waic estimates greater than 0.4.
  3.  
    ## We recommend trying loo() instead.
  4.  
    ## Model Test Parameter Mean Lower Median Upper
  5.  
    ## 9 Gaussian HC2 Correlation -0.43812 -0.9984 -6.959e-01 9.847e-01
  6.  
    ## 10 Gaussian Repc Correlation -0.91991 -0.9997 -9.643e-01 -6.103e-01
  7.  
    ## 23 C90 HC2 Correlation -0.06588 -0.7610 -1.039e-17 -7.624e-19
  8.  
    ## 24 C90 Repc Correlation -0.85157 -0.9804 -9.120e-01 -4.906e-01
  9.  
    ## 37 C270 HC2 Correlation -0.03038 -0.6452 -7.000e-18 -1.782e-18
  10.  
    ## 38 C270 Repc Correlation -0.77847 -0.9757 -7.058e-01 -5.394e-01
  11.  
    ## 51 FGM HC2 Correlation -0.07618 -0.2222 -2.215e-01 2.222e-01
  12.  
    ## 52 FGM Repc Correlation -0.19819 -0.2222 -2.222e-01 1.894e-01
  13.  
    ## 65 Frank HC2 Correlation -0.48806 -0.8140 -4.497e-01 1.000e+00
  14.  
    ## 66 Frank Repc Correlation -0.73784 -0.8627 -7.275e-01 1.000e+00
  15.  
    ## 81 BRMA Both Correlation -0.84808 -0.9839 -8.980e-01 -4.497e-01
  16.  
    ## n_eff Rhat WAIC
  17.  
    ## 9 154.238 1.0066 236.4
  18.  
    ## 10 24.342 1.0542 236.4
  19.  
    ## 23 30.089 1.0690 235.7
  20.  
    ## 24 8.532 1.1128 235.7
  21.  
    ## 37 76.410 1.0326 227.5
  22.  
    ## 38 2.945 1.4613 227.5
  23.  
    ## 51 2422.935 1.0007 245.1
  24.  
    ## 52 2550.145 0.9997 245.1
  25.  
    ## 65 2700.000 NaN 238.3
  26.  
    ## 66 2700.000 NaN 238.3
  27.  
    ## 81 102.983 1.0254 233.7

Clayton90模型具有最低的WAIC。

因此,这个例子表明,检查模型的拟合度和合理性是否充分是至关重要的,而不是盲目地依赖信息标准来选择最适合数据的标准。

从下面绘制的后验相对敏感性和特异性,所有收敛的模型通常认为重复细胞学比HC2敏感性低,而特异性没有显着损失。

拓端tecdat|R语言代写基于copula的贝叶斯分层混合模型的诊断准确性研究

讨论

基于Copula的模型提供了极大的灵活性和易用性,但它们需要谨慎使用。虽然本文中使用的copula具有吸引力,因为它们在数学上易于处理,但(Mikosch 2006)和(Genest and Remillard 2006)指出,从数据中估算copula可能很困难。此外,copula模型背后的概念稍微复杂一些,因此需要统计专业知识来理解和编程,因为它们尚未作为统计软件中的标准程序。

在本文中,简要讨论了几种用于诊断准确性研究的metat统计模型。 

在评估meta分析的敏感性和特异性以及相关性时,模型之间存在一些差异。因此,有必要进一步研究某些参数的影响,例如研究数量,样本量和联合分布的指定对meta分析的估计。

 

结论

提出的贝叶斯模型使用copula来构建二元β分布,该模型估计特定研究的敏感性和特异性,具有特定的随机效应值。

在ASCUS分类数据中,基于拟合模型的结论与作者得出的结论一致:HC2比重复细胞学检查更敏感但更轻微,并且没有明显低于特异性巴氏涂片诊断宫颈癌前病变的女性。

虽然BRMA对于两个数据集都具有最低的WAIC,但我们仍然建议使用双变量β分布对灵敏度和特异性进行建模,因为它们可以直接提供meta分析估计。

 

非常感谢您阅读本文,有任何问题请在下面留言!


拓端tecdat|R语言代写基于copula的贝叶斯分层混合模型的诊断准确性研究

最受欢迎的见解

1.Python中的Apriori关联算法-市场购物篮分析

2.R语言绘制生存曲线估计|生存分析|如何R作生存曲线图

3.用关联规则数据挖掘探索药物配伍中的规律

4.通过Python中的Apriori算法进行关联规则挖掘

5.用关联规则数据挖掘探索药物配伍中的规律

6.采用SPSS Modeler的Web复杂网络对所有腧穴进行分析

7.R语言如何在生存分析与COX回归中计算IDI,NRI指标

8.R语言如何找到患者数据中具有差异的指标?(PLS—DA分析)

9.R语言中的生存分析Survival analysis晚期肺癌患者4例

 
反对 0举报 0 评论 0
 

免责声明:本文仅代表作者个人观点,与乐学笔记(本网)无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
    本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们留言联系,本网站将在规定时间内给予删除等相关处理.

  • 拓端tecdat|R语言VAR模型的不同类型的脉冲响应
    原文链接:http://tecdat.cn/?p=9384目录模型与数据估算值预测误差脉冲响应识别问题正交脉冲响应结构脉冲反应广义脉冲响应参考文献脉冲响应分析是采用向量自回归模型的计量经济学分析中的重要一步。它们的主要目的是描述模型变量对一个或多个变量的冲击的演化
    03-16
  • Visual Studio 编辑R语言环境搭建
    Visual Studio 编辑R语言环境搭建关于Visual Studio 编辑R语言环境搭建具体的可以看下面三个网址里的内容,我这里就讲两个问题,关于r包管理和换本地的r的服务。1.r包管理:Ctrl+72.R本地服务管理:Ctrl+9Visual Studio R官方帮助文档(中文): https://docs
    03-16
  • 拓端tecdat|R语言代写实现向量自回归VAR模型
    原文链接:http://tecdat.cn/?p=8478 澳大利亚在2008 - 2009年全球金融危机期间发生了这种情况。澳大利亚政府发布了一揽子刺激计划,其中包括2008年12月的现金支付,恰逢圣诞节支出。因此,零售商报告销售强劲,经济受到刺激。因此,收入增加了。VAR面临的批
    03-16
  • [译]用R语言做挖掘数据《五》 r语言数据挖掘简
    一、实验说明1. 环境登录无需密码自动登录,系统用户名shiyanlou,密码shiyanlou2. 环境介绍本实验环境采用带桌面的Ubuntu Linux环境,实验中会用到程序:1. LX终端(LXTerminal): Linux命令行终端,打开后会进入Bash环境,可以使用Linux命令2. GVim:非常好
    03-08
  • 拓端tecdat|Mac系统R语言升级后无法加载包报错 package or namespace load failed in dyn.load(file, DLLpath = DLLpath, ..
    拓端tecdat|Mac系统R语言升级后无法加载包报错
    问题重现:我需要安装R软件包stochvol,该软件包 仅适用于3.6.0版的R。因此,我安装了R(3.6.0 版本),并使用打开它 RStudio。但是现在  ,即使我成功 使用来 安装软件包,也无法加载任何库 。具体来说,我需要加载的库是stochvol  ,Rcpp和 caret
    03-08
  • 拓端数据tecdat|R语言k-means聚类、层次聚类、主成分(PCA)降维及可视化分析鸢尾花iris数据集
    拓端数据tecdat|R语言k-means聚类、层次聚类、
    原文链接:http://tecdat.cn/?p=22838 原文出处:拓端数据部落公众号问题:使用R中的鸢尾花数据集(a)部分:k-means聚类使用k-means聚类法将数据集聚成2组。 画一个图来显示聚类的情况使用k-means聚类法将数据集聚成3组。画一个图来显示聚类的情况(b)部分:
    03-08
  • 《R语言数据挖掘》读书笔记:七、离群点(异常值)检测
    《R语言数据挖掘》读书笔记:七、离群点(异常值
    第七章、异常值检测(离群点挖掘)概述:        一般来说,异常值出现有各种原因,比如数据集因为数据来自不同的类、数据测量系统误差而收到损害。根据异常值的检测,异常值与原始数据集中的常规数据显著不同。开发了多种解决方案来检测他们,其中包括
    03-08
  • 拓端数据tecdat|R语言中实现广义相加模型GAM和普通最小二乘(OLS)回归
    拓端数据tecdat|R语言中实现广义相加模型GAM和
    原文链接:http://tecdat.cn/?p=20882  1导言这篇文章探讨了为什么使用广义相加模型 是一个不错的选择。为此,我们首先需要看一下线性回归,看看为什么在某些情况下它可能不是最佳选择。 2回归模型假设我们有一些带有两个属性Y和X的数据。如果它们是线性
    03-08
  • 拓端数据tecdat|R语言时间序列平稳性几种单位根检验(ADF,KPSS,PP)及比较分析
    拓端数据tecdat|R语言时间序列平稳性几种单位根
    原文链接:http://tecdat.cn/?p=21757 时间序列模型根据研究对象是否随机分为确定性模型和随机性模型两大类。随机时间序列模型即是指仅用它的过去值及随机扰动项所建立起来的模型,建立具体的模型,需解决如下三个问题模型的具体形式、时序变量的滞后期以及随
    03-08
  • 拓端tecdat|R语言风险价值VaR(Value at Risk)和损失期望值ES(Expected shortfall)的估计
    拓端tecdat|R语言风险价值VaR(Value at Risk)
    原文链接: http://tecdat.cn/?p=15929 风险价值VaR和损失期望值ES是常见的风险度量。首先明确:时间范围-我们展望多少天?概率水平-我们怎么看尾部分布?在给定时间范围内的盈亏预测分布,示例如图1所示。  图1:预测的损益分布 给定概率水平的预测的分
    03-08
点击排行