当先锋百科网

首页 1 2 3 4 5 6 7

生存曲线是统计与生物学领域中常见的一种曲线,用来表示一个群体或个体在某种事件或疾病下存活的时间分布情况。Python中可使用生存分析库lifelines来画生存曲线。

# 导入必要的库
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from lifelines import KaplanMeierFitter
# 创建数据集
df = pd.DataFrame({'time': [5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15],
'event': [0, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1]})
# 创建KaplanMeierFitter对象
kmf = KaplanMeierFitter()
# 对数据进行拟合
kmf.fit(df['time'], event_observed=df['event'])
# 画图
kmf.plot()
# 为生存曲线添加标签、标题等
plt.xlabel('Time (days)')
plt.ylabel('Survival probability')
plt.title('Survival curve')
plt.show()

代码中,我们首先导入必要的库,包括pandas、numpy、matplotlib和lifelines。然后,我们创建一个数据集,其中包含了每个单位所受到的事件和时间。接着,我们创建了一个KaplanMeierFitter对象,对数据进行拟合。最后,我们使用.plot()方法画生存曲线,并对曲线添加标签、标题等。

使用lifelines库可以方便地创建和画出生存曲线,用户可以根据具体需求调整曲线样式、添加标签等。通过分析生存曲线,我们可以了解到群体或个体在某种事件或疾病下的存活情况,从而指导我们的研究和实践。