武汉代孕
 
代孕
编辑部信息

社内人员:郑娜  吴亮      

主办:浙江省文学艺术界联合

国际刊号:ISSN  1002-6215

国内刊号:CN  33-1032/I

编辑出版:山海经-教育前沿杂志社

网        址:www.shjbjb.com

在线投稿: shjzzs@vip.qq.com

Q Q:779624634(郑娜编辑)     

          280747782(吴亮编辑)

                  

杂志社电话:0571-28069909





 
浅析软件工程数据的挖掘研究
发布时间:2014-12-03 17:19:24        发布人:管理员        浏览次数:381 次

浅析软件工程数据的挖掘研究

摘要:目前,数据库设计过程中最常用的方法就是根据设计要求,顺序或独立地完成物理结构和逻辑结构的设计。由于这两种结构是使用复杂的映射进行联接的,所以设计的数据库结构比较差,这种结构的特点是不灵活、效率低,这主要是设计过程的复杂性造成的。因此,在数据库设计中引入软件工程技术具有积极的意义。本文主要对数据库设计过程中各个阶段的软件工程技术进行了介绍,并与数据库设计的实践相结合,分析了软件工程技术对数据库设计的作用。

关键词:浅析;软件工程;数据挖掘;研究;

一、面对信息社会带来的“数据丰富而知识匮乏”的现实挑战,数据挖掘(Data Mining,DM)和知识发现(Knowledge Discovery,KD)技术应运而生,伴随计算机新技术和新理论的出现而发展,在电信与银行,生物及大型超市等领域运用效果显著。数据挖掘有时又称作数据库知识发现(KDD),此术语出现于1989年,从数据集识别有效与新颖的,潜在有用的,最终可理解的模式过程。KDD过程常指多阶段处理,包括数据准备与模式搜索,知识评价及反复修改求精;该过程要有智能性和自动性。有效性指发现新数据仍保持可信度,新颖性要求模式应是新的,潜在有用性指发现的知识将来有效用,最终可理解性要求发现模式能被用户所理解,几项综合在一起称为数据的科学性�豍。计算机领域新技术应用使各行业生成、收集和存储了大量数据。大量信息数据给社会带来方便也带来大堆问题:信息过量,难以消化;信息真假难以辨识;信息安全难以保证;信息形式不一致而难以统一处理。一般数据库系统可高效实现数据录入、查询与统计等功能,却无法发现数据存在的关系和规则。如何辨析信息和如何不被信息淹没已经成为现实问题。数据挖掘的界定是从存放在数据库与数据仓库或其它存储信息库中的海量数据挖掘有趣知识过程。一般的定义是:数据挖掘是从大量、不完全、有噪声、模糊、随机的数据中抽取隐含其中,事先不为人所知、潜在、有效、新颖、有用和最终可理解知识的过程。研究人工智能学术人员和计算机技术专家通常所说数据挖掘名称各异但实质一样。自然世界数据以多种多样形式存放,除最常见数字与字符等类型,还有许多复杂数据。复杂类型数据挖掘包括:空间数据挖掘和多媒体数据挖掘,时序数据挖掘和文本数据挖掘,Web数据挖掘与流数据挖掘等。数据挖掘与传统数学统计分析有区别,数据挖掘在没有明确假设前提下自动建立方程,可采用不同类型如文本、声音、图片等的数据挖掘兴趣模式;统计数据分析工具侧重被动分析,需建立方程或模型来与假设吻合,最终面对数字化数据;数据挖掘是主动发现型与预测型数据分析工具,分析重点在于预测未来未知潜在情况并解释原因。软件工程概念源自软件危机,20世纪60年代末的“软件危机”这个词语频繁出现计算机软件领域,泛指计算机软件开发和维护所遇到的系列严重问题。在软件开发和维护过程中的软件危机表现为软件需求的增长得不到满足,软件开发成本和进度无法控制,软件质量难保证,软件维护程度非常低,软件成本不断提高,软件开发生产率赶不上计算机硬件发展和各种应用需求增长等。软件危机产生的宏观原因是软件日益深入社会生活,软件需求增长速度超过软件生产率提高,具体软件工程任务的许多困难来源于软件工程所面临任务和其他工程之间各种差异以及软件和其他工业产品的差异,即特殊性。软件开发和维护过程存在的问题,与计算机软件本身特点有关,软件开发过程进度很难衡量,软件质量难以评价,管理和控制软件开发过程困难等。计算机软件专家认真研究解决软件危机方法,逐步形成软件工程概念,开辟工程学新领域即软件工程学。软件工程用工程、科学和数学原理与方法研制与维护计算机软件有关技术及管理的方法。软件工程针对数据的处理具有系统的规范的系列办法。1993年IEEE(电气和电子工程师学会)给软件工程综合定义为:将系统化、规范和可度量的方法应用于软件开发、测试、运行和维护全过程,即将工程化应用于软件数据等设计中。软件工程包括方法、工具和过程三个要素,方法是完成软件工程项目技术手段;工具支持软件开发、管理与文档生成;过程支持软件开发各个环节控制与管理。软件工程的发展伴随计算机与数据等相关技术的发展而进步。三、软件工程的知识库应用数据挖掘技术。蕴含数据的特殊软件的生命周期也是一个极其复杂演变过程,各个阶段都会产生大量软件数据。在设计文档与程序源代码,交流历史与Bug报告,软件运行日志等方面产生的大量数据,必然存在着对软件开发和维护具有重要价值的信息。如能充分利用数据挖掘技术发现这些数据隐藏的知识,可提高开发效率并避免错误,增强软件系统运行稳定性和可信性。利用数据挖掘技术处理软件产生大量数据想法在上世纪70年代就出现,但直到最近软件数据挖掘领域才受到越来越多学者关注�豏。软件工程国际会议出现关于软件数据挖掘研究工作组,许多数据挖掘会议与期刊陆续出现多篇高质量与软件工程相关学术论文,软件数据挖掘已成为越来越关注热点的研究领域。软件数据挖掘针对软件工程版本控制,设计文档及程序源代码演化历史等进行挖掘,同时,我们也可设计软件工程数据仓库来统一存储这些可利用的大量软件的数据。应用传统数据挖掘的经典算法来处理存放在软件知识库的各种数据,提取有用信息来辅助软件设计、开发与维护。会为开发人员提供有效的帮助。通过利用关联规则挖掘算法寻找那些经常被一起改变的实体如类、变量、函数、数据类型与控制语句等;或者利用关联规则挖掘源代码修改模式,挖掘存放在代码库软件修改历史模式;或者应用关联规则挖掘实体间依赖性,改进系统架构相关研究;或者通过对用户操作日志与系统运行状态日志研究,建立基于用户操作模式系统稳定性预测模型等等。

结语:软件工程数据集软件知识库包含的关于软件工程演化历史大量有价值的信息数据,为研究和利用这两类优质数据,数据挖掘技术大有可为。挖掘其潜力在软件工程快速发展的潮流中具有举足轻重的作用。数据挖掘应对数据丰富而知识匮乏的挑战,着眼于数据实用性对软件工程知识库的数据进行深度挖掘。




投稿要求:

1.内容要求:坚持正确的舆论导向,遵循新闻传媒规律。有自己独到的理论见解,或独特的实践做法。

2.摘要:用第三人称写法,不以“本文”、“作者”等作主语,应是一篇能客观反映文章核心观点和创新观点的表意明确、实在的小短文,切忌写成背景交代或“中心思想”,100-200字为宜。

3.正文标题:内容应简洁、明了,层次不宜过多,层次序号为一、(一)、1、(1),层次少时可依次选序号。

4.正文文字:一般以4000字符为宜,正文用小4号宋体,通栏排版,每版平均2000字符。

5.基金项目: 获得国家基金资助和省部级科研项目的文章请注明基金项目名称及编号,按项目证明文字材料标示清楚。

6.作者简介:姓名(出生年- ),性别,民族(汉族可省略),籍贯,现供职单位全称及职称、学位,研究方向。

7. 来稿请注明作者电话、E-mail,收刊人及详细地址、邮编。

8.其他:请勿一稿两发,并请自留原稿,本刊概不退稿。

投稿邮箱:1911365536@qq.com;       2191974423@qq.com(注明投稿刊物名称)

咨询QQ:1911365536;         2191974423

咨询电话:0571-28069909(咨询时间:周一至周六 9:00--17:00)

网址:www.shjbjb.com

欢迎咨询供稿,并诚招各大高校代理约稿人!

注:本杂志社会根据版面安排适当编辑文章内容,作者如不同意论文被修改,请来搞注明。如有基金项目支持,请注明基金项目编号。

| | | | | |
版权所有 Copyright(C)2013-2025 理论前沿-理论前沿编辑部-山海经杂志社 www.shjbjb.com    

代孕|北京代孕|武汉代孕|代孕|武汉代孕|深圳代孕|武汉代孕|代孕|武汉代孕|代孕| 捐卵 |代孕网|武汉代孕|武汉代孕|捐卵| 武汉代孕|代孕|代孕|代孕网 |武汉代孕 | 广州代孕 |捐卵|上海代孕|代孕公司|武汉代孕|武汉代孕 | 捐卵|代孕中介|代孕