软件工程论文开题报告(软件工程论文开题报告模板)
然而,对于云计算或分布式系统中更具体的问题的相关研究,尤其是国内相关领域的相关研究相对较少。也可以说,那些为数据存储和访问而设计的分布式系统被称为分布式存储系统。与普通软件系统不同,分布式存储系统具有以下特征。因此,分布式存储系统对整个群集具有高性能。
一、选题背景
当今的互联网服务面临着许多挑战和不断变化的需求,包括需要管理大量数据和为快速增长的用户群提供可持续和可靠的服务。这里提到的互联网服务包括例如在线邮箱、搜索引擎、在线游戏、在线金融系统、内容分发网络、文件共享网络等。因此,能够提供这些互联网服务的系统通常非常大:它们由数百台机器组成,并且这些机器可能在相同的数据中心里,或者它们可能分散在不同的数据中心,并且通过独立的网络相互通信。在具有如此巨大可伸缩性的集群中,错误的发生是非常常见的:一些机器可能在任何时候遇到硬件或软件故障;网络延迟和网络故障可能随时发生,导致数据包丢失、网络分区等。意外的恶意攻击或操作错误也可能导致不可预测的灾难性错误。因此,用于构建这样一个系统的软件通常非常复杂。同时,每隔一段时间,系统需要修改(升级)以提高性能、修改错误或添加新功能。这项工作面临的最基本的问题是如何有效地设计一个工程上可行的升级方案,使这种规模的分布式系统能够在升级过程中持续提供服务。
二。研究的目的和意义
目前,云计算非常流行。各种互联网公司、银行和政府经常提到云计算,各种分布式系统层出不穷。无论是著名的大型分布式产品的开源项目,如Hadoop、开放堆栈、Mongo数据库等。或者是国内外著名的云计算服务提供商亚马逊AWS,Microsoft Azure和阿里云,云计算已经从纸上或宣传口号走向了真正的落地舞台。然而,对于云计算或分布式系统中更具体的问题的相关研究,尤其是国内相关领域的相关研究相对较少。国内工业中的著名制造商似乎都在闷声不响地制造汽车。(651933)和解决云计算工程中实际具体问题的研究成果(651933)还很少。我知道我的能力有限,我只受益于研究生期间的一些实习经历。结合工程实践,对分布式系统升级和数据迁移问题做了一些总结和提炼工作,具有一定的创新性。
第三,本研究涉及的主要理论
分布式系统是一种软件系统,其组件分布在联网的计算机上,组件通过传递消息来通信和协调它们的动作[2]。分布式系统是一个统称。常见的有分布式操作系统、分布式编程语言及其编译(解释)系统、分布式文件系统和分布式数据库(存储)系统等。本文面临的升级和数据迁移问题涉及到更多的分布式存储系统,其定义如下:分布式存储系统是大量通过互联网互联的普通个人计算机服务器,为整个外部世界提供存储服务。也可以说,那些为数据存储和访问而设计的分布式系统被称为分布式存储系统。与普通软件系统不同,分布式存储系统具有以下特征。了解这些特征对于解决本文提出的问题具有根本的意义。可扩展性:分布式存储系统的可扩展性是最重要的优势,它通常可以扩展数百个单元。同时,随着集群规模的增长,系统的整体性能呈线性增长。此外,数据和请求可以根据某些策略分配到不同的物理节点。物理节点的数量与集群的处理能力成正比。该集群可线性扩展。同时,集群是否可以扩展以及是否可以线性扩展是衡量分布式存储系统的一个重要指标。低成本和高性能:分布式存储系统具有自动容错和自动负载平衡机制,使其能够构建在普通电脑上。此外,线性扩展能力也使得增加和减少机器非常方便,可以实现自动操作和维护。因此,分布式存储系统对整个群集具有高性能。数据分布:分布式存储系统与独立存储系统的最大区别在于,它可以按照一定的方法对数据进行切片,不同的物理节点会分布不同的数据切片,从而将系统的存储容量压力和访问请求压力分布到系统集群的每个物理节点,使系统整体能够存储超大量的数据,接受更多的并发请求。那么,如何将数据分布到多个服务器以确保数据分布均匀呢?将数据分发到多台服务器后,如何实现跨服务器读写操作?常用的数据分片和分发方法有两种:一种是哈希分区方法,即根据数据的关键字,将哈希离散地模块化并分发到集群的物理节点,亚马逊的迪纳摩使用一致的哈希算法进行分区;b .连续划分方法,即根据关键字对整个数据集进行排序,并根据关键字的范围进行切片。
第四,本文的主要内容和研究框架
(一)本研究的主要内容
本书论文分为六章,主要内容如下:
第一章是绪论。本文介绍了本论文的研究背景,简要描述了云计算和分布式系统的现状,系统升级的必要性,以及本文的主要工作和组织结构。
第二章是文献综述。本文介绍了分布式系统的相关基础理论,分析了一些典型的Nosql系统,总结了单机软件的成熟升级方案以及前人在分布式系统升级方面的一些研究成果。
第三章是难点分析和总体设计。本章系统分析了分布式系统升级的难点,提出了高可用分布式系统升级设计的基本概念和原则。在此基础上,提出了该问题的总体设计方案。
第四章是详细的设计和实现。本章在前一章的基础上,依次详细设计了单数据中心和跨数据中心的分布式环境下的系统升级方案,这是论文中最重要的一章。
第五章是方案的测试和实施。在详细设计和实现的基础上,本章提出了相应的测试和实现方案,并通过测试分析和实验分析验证了升级方案的有效性。
第六章是总结和展望。本文综述如下
摘要5-6
第一章导言9-11
1.1研究背景9
1.3本条的组织结构10-11
2.1分布式相关理论11-14
2.1.1基本概念和特征11-12
2.2典型Nosql系统分析14-19
2.2.1表15-16
2.2.2发电机16-18
2.2.3卡珊德拉与大桌和迪纳摩18-19的比较
2.5本章概述22-23
第三章难度分析和总体设计23-32
3.2高可用性分布式系统升级设计25-27
3.2.2升级设计的基本原则26-27
3.3总体设计方案27-31
3.3.2程序步骤28-30
3.3.3亮点30-31
3.4本章概述31-32
第四章详细设计和实施32-51
4.2单数据中心分布式系统升级33-38
4.2.1设计重要性33-34
4.2.2详细设计34-38
4.3跨数据中心的分布式系统升级38-42
4.3.1差异分析38
4.3.2概述38-39
4.3.3读写请求的处理39-40
4.3.4详细步骤40-42
4.4主要模块42-49的实施
4.4.2主模块44-46的升级
4.4.3数据迁移模块46-48的实施
4.4.4回调函数的实现48-49
4.5本章概述49-51
第五章方案实施和测试51-70
5.1方案实施51-57
5.1.1系统部署51
5.2方案测试57-66
5.2.1单元测试57-61
5.2.2集成测试61-63
5.2.3系统测试63-66
5.3实际生产环境测试结果66-69
5.4本章概述69-70
第六章总结与展望70-72
6.1审查和总结70-71
6.2前景71-72
参考文献72-74
确认74
六、本文的研究进展(略)
七.参考
[5]阿曼多福克斯和埃里克布鲁尔,收获,产量和可扩展的容忍系统,程序。第七届操作系统热点专题研讨会,电气与电子工程师学会会刊,1999年,第10页。174-178。
[6] MSBI #72商业智能# 5大数据# 2什么是大数据?什么是无SQL?Microsoft与SQL Azure、Windows Azure、大数据和无SQL的关联关系是什么?
[7]诺斯克。维基百科。http://zh.wikipedia.org/zh-cn/No SQL。
[8]常,费伊,等.结构化数据的分布式存储系统.美国计算机学会计算机系统交易(TOCS) 26.2 (2008): 4。[9]朱塞佩德坎迪亚,德尼兹哈斯托伦,马丹贾姆巴尼等。电动:亚马逊高可用的键值存储。