DEAP2.1保姆级教程:从数据准备到结果解读(含CCR/BCC模型对比)

张开发
2026/4/12 13:55:16 15 分钟阅读

分享文章

DEAP2.1保姆级教程:从数据准备到结果解读(含CCR/BCC模型对比)
DEAP2.1实战指南从零掌握数据包络分析核心技术第一次打开DEAP2.1时面对黑底白字的DOS界面和一堆参数文件大多数研究者都会感到无从下手。这个诞生于1996年的经典DEA分析工具至今仍是效率评估领域的重要选择——它轻量、稳定能处理CCR和BCC两大基础模型但陡峭的学习曲线让很多宝贵数据在错误操作中变成了无效结果。本文将带你避开新手常踩的15个坑用真实科研项目中的数据案例演示如何从原始Excel到最终效率值的完整分析流程。1. 环境配置与数据准备安装DEAP2.1只需要将压缩包中的两个核心文件DEAP.EXE和DEAP.000解压到同一文件夹。但真正影响分析成败的是数据文件的规范准备。我们以医疗机构效率评估为例假设有30家医院作为决策单元(DMU)投入指标包括医护人员数、床位数、设备价值等5项产出指标为年门诊量、手术量2项。正确的数据文件(data.dta)格式要求纯文本格式建议用Notepad编辑产出指标必须排在投入指标之前各数值间用单个空格分隔不能用Tab或连续空格末尾不能有空行# 示例数据前5行医院1至医院5 42310 1523 125 89 3.2 56 1200 38542 1320 118 76 2.9 48 980 40125 1450 122 82 3.0 52 1100 36210 1280 115 72 2.8 45 920 41280 1390 120 85 3.1 54 1050注意数据中若包含小数必须使用点号(.)而非逗号(,)作为小数点否则会导致程序报错Invalid number format。2. 参数文件深度解析ins文件是DEAP2.1的大脑每个参数都直接影响模型运算逻辑。以CCR模型为例典型配置如下data.dta # 数据文件名 result.out # 输出文件名 30 # 医院数量 1 # 时间周期数截面数据填1 2 # 产出指标个数 5 # 投入指标个数 0 # 0投入导向 1产出导向 0 # 0CCR(CRS) 1BCC(VRS) 0 # 分析方法选择关键参数对比表参数位置CCR模型设置BCC模型设置作用说明第6行0或10或1导向类型不影响效率值计算只影响松弛变量方向第7行01规模报酬假设是两模型核心区别第8行00多阶段分析法最常用曾有个博士生的论文数据异常最终发现是误将面板数据的时间周期数设为1。对于跨期比较需要设置正确的时间段数量第8行选择2MALMQUIST-DEA数据文件按时间顺序排列所有DMU3. CCR与BCC模型实战对比运行DEAP2.1只需将编写好的ins文件拖到DEAP.exe上或在命令行输入DEAP.exe 参数文件名.ins。我们使用同一组医疗数据分别运行两种模型CCR模型输出解读EFFICIENCY SUMMARY: firm te 1 0.873 2 0.925 ... 30 0.812 mean 0.856te列即技术效率值1表示完全有效该模型假设规模报酬不变效率值包含规模因素BCC模型新增维度EFFICIENCY SUMMARY: firm crste vrste scale 1 0.873 0.945 drs 2 0.925 0.981 irs ... 30 0.812 0.889 drs mean 0.856 0.932vrste是纯技术效率排除了规模影响scale列显示规模报酬状态drs递减/irs递增/-不变crste与CCR的te值完全相同数学证明可参考Cooper的DEA经典教材在医疗效率分析中某三甲医院CCR效率值0.82BCC分析显示其vrste达0.97但处于drs状态说明管理已优化但规模过大导致资源浪费——这正是两种模型配合使用的价值。4. 高频报错解决方案库错误1Data file not found检查data.dta是否与DEAP.exe同目录文件名是否与ins文件第一行完全一致包括后缀错误2Number of firms incorrect确认数据行数等于ins文件第三行数值删除数据文件末尾可能存在的空行错误3Efficiency results all1常见于投入产出指标反向检查数据文件是否产出指标在前确认指标数量设置正确某研究团队连续3天得到全1的效率值最终发现是Excel转文本时自动添加了制表符。建议使用Python预处理import pandas as pd df pd.read_excel(hospital_data.xlsx) with open(data.dta,w) as f: for row in df.values: f.write( .join(map(str,row))\n)5. 高级应用技巧跨模型分析策略先用CCR筛选总体有效单元对无效单元进行BCC分析结合scale值制定改进方向irs单位应扩大规模drs单位需精简业务敏感度分析方法逐步剔除各投入产出指标观察效率值变化幅度识别最关键的影响因素某医保局项目通过这种方法发现设备利用率对社区医院效率影响权重达37%远高于床位使用率12%据此调整了资源配置政策。6. 结果可视化呈现原始out文件数据可导入Excel或R进行深度分析。推荐使用ggplot2绘制效率值分布library(ggplot2) eff_data - read.table(result.out, skip10, headerFALSE) ggplot(eff_data, aes(xV2)) geom_histogram(bins15, fillsteelblue) labs(title医院效率值分布, x技术效率, y频数)对于BCC模型可以制作效率-规模气泡图X轴为纯技术效率Y轴为规模效率气泡大小代表DMU规模颜色区分irs/drs状态——这种可视化能直观显示各决策单元改进方向。

更多文章