开源社区级联崩塌效应分析及基于SVM的项目失败预测

【摘要】 以Github社区为例,通过采集海量社区项目的数据,分析了开源项目在开发过程中的风险传递和级联崩塌反应.通过重点分析技术关联和合作关联这两种开源项目之间最为常见的风险传递模式,结合采集数据,得出单一项目失败会产生一定规模的级联崩塌反应.其次,针对Github开源社区的大量成功和失败项目的数据,通过设计合理特征,基于支持向量机对成功与失败的项目数据进行训练,通过数据清洗和优化方法,使得训练得到的模型可以较好的对项目失败风险进行预测,对于开源社区的长久发展和风险评估提供了有效依据.关键词:开源社区;级联崩塌效应;支持向量机;分类预测