本文是一篇系统结构论文范文,系统结构类硕士毕业论文,关于计算机绘图相关在职研究生毕业论文范文。适合系统结构及计算机及计算机系统结构方面的的大学硕士和本科毕业论文以及系统结构相关开题报告范文和职称论文写作参考文献资料下载。
计算机系统结构课程内容体系及实践课程研究报告
张晨曦刘依
同济大学软件学院
1引言
计算机系统结构是高等院校计算机专业的一门专业主干课程.本课程的目标是提高学生从系统和总体结构的层次来理解和研究计算机系统的能力,帮助学生建立整机系统的概念,使学生掌握计算机系统结构的基本知识,掌握基本的性能分析方法,并对计算机的JohnL.Hennessy和加州大学伯克利分校的着名教授DidA.Patterson联手于20世纪90年代初出版的ComputerArchitecture:AQuantitativeApproach一书在这个领域激起了一阵改革的浪花,它从全新的角度讲述系统结构,受到了同行的高度赞赏.虽然从1996年开始,我们就在国内(国防科技大学)率先在该课程中采用该书中的内容,但到目前为止,国内尚未看到关于如何调整计算机系统结构课程的内容体系的报告.本项目就是要在对国外教材和国内教材进行深入研究的基础上,面向重点大学的计算机专业,确定出既采用国外教材的优点又继承国内现有教材特色的系统结构课程的内容体系,并对其实践课程进行研究.
2对国外系统结构教材内容的研究
计算机系统结构的英文是puterarchitecture,用这个词作为关 键 词,在国外着名的网上书店amazon.,国外着名的出版社ManKaufmann和PrenticeHall的网站以及其他一些网站上进行检索,查到以下8本主要的系统结构方面的书(近5年):
(1)书名:ComputerArchitecture:AQuantitativeApproach(3rdEdition)
作者:JohnL.Hennessy,DidA.Patterson
出版时间:2002年5月
出版商:ManKaufmann
国内出版社引进情况:电子工业出版社(中),机械工业出版社(英)
页数:1136
简称(为了本文的论述方便而采用的简称,下同):【Henn3】或【H3】
(2)书名:ComputerArchitecture:AQuantitativeApproach(4thEdition)
作者:JohnL.Hennessy,DidA.Patterson
出版时间:2006年9月
出版商:ManKaufmann
国内出版社引进情况:电子工业出版社(中),机械工业出版社(英)
页数:704
简称:【Henn4】
(3)书名:ParallelComputerArchitecture:AHardware/SoftwareApproach
作者:DidCuller等
出版商:ManKaufmann
出版时间:1998年8月
国内出版社引进情况:机械工业出版社(中)
页数:1100
简称:【Culler】
(4)书名:EssentialsofComputerArchitecture
作者:DouglasE.Comer
出版商:PrenticeHall
出版时间:2004年8月
国内出版社引进情况:清华大学出版社(中),高等教育出版社(英)
页数:400
简称:【Comer】
(5)书名:PrinciplesofComputerArchitecture
作者:M.Murdocca,V.P.Heuring
出版商:PrenticeHall
出版时间:2000年
页数:640
简称:【Murd】
(6)书名:ComputerArchitecture:FromMicroprocessorstoSuperputers
作者:BehroozParhami
出版商:OxfordUniversityPress
出版时间:2005年2月
页数:575
简称:【Parha】
(7)书名:ComputerSystemArcitecture:ANetworkingApproach(2ndEdition)
作者:RobWilliams
出版商:PrenticeHall
出版时间:2006年11月
国内出版社引进情况:机械工业出版社(英)
页数:752
简称:【Willi】
(8)书名:AdvancedComputerArchitectureandParallelProcessing
作者:HeshamEl-Rewini,MostafaAbd-El-Barr
出版商:Wiley-Interscience
出版时间:2005年1月
国内出版社引进情况:电子工业出版社(中)
页数:288
简称:【Rewini】
在这些书中,【Culler】和【Rewini】主要是论述高级体系结构和并行处理体系结构,这部分内容一般是在研究生阶段才学习的,所以它们不适合作为本科生的教材,但可以作为研究生的教材或参考书.
【Comer】是由美国普渡大学资深教授DouglasE.Comer编写的.该书有20章,内容包括:数字逻辑基础,数据和程序的表示,各种处理器和计算引擎,处理器类型和指令系统,操作数寻址和指令表示,CPU:微代码,保护及处理器模式,汇编语言和程序设计范例,存储器,物理存储器和物理寻址,虚拟存储器技术和虚拟寻址,高速缓存和高速缓存技术,输入输出概念和术语,总线和总线体系结构,程序控制I/O和中断驱动I/O,程序员眼中的设备,I/O和缓冲,并行性,流水线技术,性能评估,体系结构的层次和例子.可以看出,这些内容的一半以上与我们国内的计算机组成原理课程的内容重叠,而对系统结构的论述又深度不够.
【Murd】共有10章,包括数据表示,算术运算,指令集结构,语言和机器,数据通路和控制,存储器,输入输出,通信,系统结构的发展趋势等.【Parha】分成7部分,共28章.这7部分是:背景和动机,指令集结构,算术/逻辑部件,存储系统设计,输入/输出和接口,高级系统结构.这两本书存在与【Comer】类似的问题,相当一部分内容属于计算机组成原理的内容.
【Willi】共有23章,篇幅达752页.主要内容有:vonNeumann结构,功能部件及取指-执行周期,控制部件,ALU,存储器,PentiumCPU,子程序,简单输入/输出,串行连接,并行连接,存储层次,编程者的观点,局域网,广域网,其他网络,操作系统简介,WindowsXP,文件系统,可视输出,RISC处理器:ARM和SPARC,VLIW处理器:EPICItanium,并行处理.这本书不仅包含组成原理的内容,而且还包含了操作系统,网络方面的内容.可谓包罗万象.
内容涉及面太广,与计算机组成原理课程重复,系统结构内容深度不够等缺点是国外大多数系统结构教材的通病.也许其目的是为了不需要计算机组成原理的铺垫就可以学习系统结构.但国内一般都是先学计算机组成原理,后学系统结构的,所以这些教材不太适合"中国国情".
JohnL.Hennessy和idA.Patterson编写的ComputerArchitecture::AQuantitativeApproach彻底改变了这种状况.这两个人是享誉全球计算机界的着名教授,他们在RISC研究方面取得了卓越的成绩,其研究结果分别形成了MIPS和SPARC系统结构的基础.十多年前,该书第1版一出现,就好评如潮.到去年为止,已经出了4个版本.这是一本在全世界有很大影响的教材,被称为是系统结构学科的"圣经",在国外已经被许多大学选用.在国外同类教材中,它是最权威,最有影响的一本.它对系统结构进行了深入,全面的阐述,并且在讲述中采用了国际上流行的研究计算机系统结构的方法——量化方法.该书的内容充分反映了当前系统结构的主流发展,而且结构合理,内容新颖,可读性好.我们多年的教学研究和实践表明,采用量化方法的教学效果很好.
这本教材的第3版【Henn3】有1100多页,虽然内容丰富,但也太多,太全,难度偏大,我们认为直接作为本科生的教材是不合适的.而且该教材不足之处还有工程性太强,对有些经典的计算机系统结构内容没有论述(如向量处理机,阵列处理机,数据流计算机等).这本书的第4版【Henn4】虽然是最新版,但在编排上更像是研究生教材.所以后面我们将主要以【Henn3】作为参考书,与国内的系统结构教材内容相结合,取长补短,研究并确定出计算机系统结构课程的内容体系.
3对国内系统结构教材内容的研究
在计算机专业教材方面,国内最有影响的出版社有:清华大学出版社,高等教育出版社,电子工业出版社,机械工业出版社,科学出版社,人民邮电出版社等.在这些出版社的网站以及在中国互动出版网china-pub.上,我们用"系统结构"和"体系结构"作为关 键 词查询,查出了这些出版社在近5年来出版的所有系统结构教材情况如下:
清华大学出版社:4本.作者分别是郑纬民,李学干,尹朝庆,周立等.
虽然郑纬民的那本是1998年出的,但因为它是国内比较经典的一本系统结构教材,所以把它也列为研究的对象.李学干的那本也是比较经典的,是"十一五"国家级规划教材.其前身是苏东庄编写的系统结构教材.25年前我们上大学时就使用过.
高等教育出版社:1本,作者是张晨曦等.这本书是"十五"国家级规划教材.
电子工业出版社:2本,作者分别是陈建铎和徐炜民等.徐炜民那本是"十五"国家级规划教材.
机械工业出版社:1本,作者是田俊峰等.Henn3】(简称为【H3】)和【Henn4】原版教材,对其内容进行了研究和比较,并做出了我们的选择.
(1)第1章
第1章一般都是引言,导论,基本概念或基础知识等,上述教材中,这一章的内容比较接近,主要有:
计算机系统结构的基本概念(包括计算机系统的层次结构,系统结构的定义以及计算机组成和计算机实现的概念等),
计算机系统结构的分类,
计算机系统的性能评测(包括定量设计原理,性能评测指标,基准测试程序等),
计算机系统结构的发展(包括冯·诺依曼结构以及软件,应用,器件对系统结构的影响等),
并行性的概念及并行性的发展.
【Henn3】和【张】都有一节论述计算机成本和价格方面的内容.根据我们以前的教学经验,这一节几乎都是不讲的,所以在新的内容体系中,屏弃该内容.
(2)指令系统的设计
在下面以及后面的表格中,√表示有相应的内容,而空栏则表示没有.
从表1可以看出,绝大多数教材都有这部分内容.
表1
编号内容【郑】【李】【白】【尹】【周】1浮点数据表示和自定义数据表示√√无此
内容√√2指令系统的分类3寻址技术√√√√4指令格式的优化设计√√√√5指令系统的功能设计√√√6RISC√√√√7指令系统举例
表1(续)
编号【徐】【陈】【田】【张2】【张】【H3】要否说明1注1-1√√×注1-22√√√√注1-33√√√√√√4√√√√√√5√√√√√√6√√√√√√7PDP-11,RISC-ⅡIBM370DLXMIPIPS注1-4注1-1:【徐】与其他教材不同,设置了名为"计算机系统结构"的一章,论述的内容包括:CPU组成,数据表示,寻址方式,指令优化,总线结构,存储系统概述,输入输出等内容.相当于给系统结构的方方面面来个概述.这些内容中有相当一部分是与计算机组成原理重复的.我们不采用这种写法.
注1-2:浮点数据表示应该在其他课程(如原理)中讲过,没必要在这里重复论述.自定义数据表示虽然是新内容,但由于这种技术在一般的计算机中很少采用,所以不讲也可以.
注1-3:指令系统的分类对于进一步加深对不同指令系统的理解有较大的作用.
注1-4:【陈】中介绍的PDP-11和RISC-Ⅱ以及【田】中介绍的IBM370已比较陈旧.【张】中介绍的是抽象指令系统DLX,它只是在前几年比较流行.在本报告的方案中,我们将和【H3】一样,采用MIPS作为例子.MIPS与DLX都是RISC结构,而且有很多相似的地方.两者的关键区别是:DLX是假想的,MIPS是真实的.MIP
本文是一篇系统结构论文范文,系统结构类硕士毕业论文,关于计算机绘图相关在职研究生毕业论文范文。适合系统结构及计算机及计算机系统结构方面的的大学硕士和本科毕业论文以及系统结构相关开题报告范文和职称论文写作参考文献资料下载。
S是一种很有影响的RISC处理器结构,也比较简单,用它做例子是一个很好的选择.这里介绍MIPS指令系统是必需的,因为后面各章中的例子以及本课程的实践环节都是建立在MIPS指令系统之上的.(3)流水线技术
流水线技术几乎是所有系统结构教材都讲的内容.它是系统结构课程最经典的内容,也是重点之一.要系统地展开论述.
表2
编号内容【郑】【李】【白】【尹】【周】1重叠执行和先行控制√注2-1注2-1√√2流水线的概念与分类√√√√√3流水线的时空图与性能分析√√√√√4非线性流水线的调度√√√√5流水线的相关与冲突√√√√√6指令流水线的实现实例
表2(续)
编号【徐】【陈】【田】【张2】【张】【H3】要否说明1√√√√√注2-32√√√√√√3√√√√√√√4√√√√注2-45注2-2√√√√√√6√√√注2-1:【李】和【白】只讲了重叠执行,没有介绍先行控制.
注2-2:【徐】对于相关只做了简单的介绍.
注2-3:重叠执行和先行控制是使用比较多的技术,所以把该内容选入本方案.
注2-4:这10本教材中,有7本是包含了"非线性流水线的调度",而且这部分内容也是比较重要的.故将其选入本方案.
(4)指令级并行性及其开发
指令级并行性开发是提高计算机系统性能的重要技术.有必要系统地讲述这部分内容.相对于系统结构的经典内容来说,这部分内容是比较新的.国内的教材除了【郑】,【周】,【张】以外,这部分内容比较少.在本方案中,我们选入所有表3中列出的内容.
表3
编号内容【郑】【李】【白】【尹】【周】1指令动态调度的基本思想√√√2记分牌算法√3Tomasulo算法√√√4动态分支预测技术√√5基于硬件的前瞻执行6超标量技术√√√√√7超长指令字技术√√√√√8超流水技术√√√√√
表3(续)
编号【徐】【陈】【田】【张2】【张】【H3】要否说明1无此
内容√√√√2√√√3√√√4√√√√5√√√6√√√√√√7√√√√√8√√√√√√
(5)用软件方法开发指令级并行
这部分内容是【H3】所独有的,是开发指令级并行的一些高级技术.考虑到本方案是面向重点大学的计算机专业,我们将选用这些内容.
(6)向量处理机
关于这部分内容,有的教材是单独设置一章,而有的则是把它合并到流水线技术一章中.【郑】,【白】,【陈】是单独设置一章,其他的都是与流水线技术合并.本方案的选择是单独设置一章.
表4
编号内容【郑】【李】【白】【尹】【周】1向量处理机的基本概念√√√√√2向量处理方式√√√√√3向量处理机的结构√√√√√4提高向量处理机性能的方法√√√5向量处理机的性能评价√√√√6向量处理机实例Cray-1,CrayY-MP,C90,FujitsuVP2000,VPP500Cray-1Cray-1,CrayY-MP,C90,NECSX-XCray-1,FPS-164Cray-1
表4(续)
编号【徐】【陈】【田】【张2】【张】【H3】要否说明1√√√√√附录光盘中有相关的内容√2√√√√√√3√√√√√4√√√√5√√√6Cray-1,CrayY-MP,C90CrayY-MPCray-1,CrayY-MP,C90Cray-1Cray-1,CrayY-MP,C90注4-1注4-1:使用最多的实例是Cray-1,CrayY-MP和C90.
(7)存储系统
存储系统也是系统结构课程的最经典,最重点的内容之一.要系统地展开论述.
表5
编号内容【郑】【李】【白】【尹】【周】1存储系统的概念和参数√√无此
内容√√2存储层次√√√√3并行存储器√√√√4Cache的地址映像与地址变换√√√√5Cache替换算法的实现√√√√6Cache性能分析√√√√7降低Cache失效率的方法8减少Cache失效开销的方法9减少命中时间的方法10虚地址Cache√11虚拟存储器√√√√12页面替换算法的模拟过程√√√√13存储层次举例14主存保护√
表5(续)
编号【徐】【陈】【田】【张2】【张】【H3】要否说明1√√√√√√√2√√√√√√√3√√√√√√√4√√√√√简单√5√√√√×注5-16√√√√√√√7√√√8√√√9√√√10√√√√11√√√√简单简单简单注5-212√√√√×注5-313√√√√14√√√√√×注5-1:这部分内容主要是讲LRU替换算法的硬件实现.由于随机算法实现简单,因而被广泛采用,而且在容量较大时,采用LRU替换算法和采用随机算法时的失效率差别不大.所以本方案放弃这部分内容.
注5-2:虚拟存储器在操作系统课程中是重点内容之一,读者应该是比较熟悉了.所以这里不必再去重复讲述相同的内容,而只要简单地讲述在系统结构级对虚拟存储器所提供的支持.
注5-3:页面替换算法的模拟过程是国内系统结构教材中比较典型的内容,占的篇幅还不少.这部分内容对于加深理解替换算法虽然有些作用,但由于替换算法本身就比较简单,我们认为可以不要这部分内容.
(8)输入输出系统
虽然在我们研究的国内教材中,有一半的教材没有这部分内容,但我们认为:作为计算机系统的一个重要组成部分,还是应该将之纳入我们的内容体系中.只是要避免与计算机组成原理课程重复相同的内容.
表6
编号内容【郑】【李】【白】【尹】【周】1基本概念√√无此
内容无此
内容无此
内容2输入输出方式√3总线√4中断√√续表
编号内容【郑】【李】【白】【尹】【周】5RAID6通道处理机√√7I/O与操作系统
表6(续)
编号【徐】【陈】【田】【张2】【张】【H3】要否说明1无此
内容无此
内容√√√√√2√×计算机组成原理教材中一般都已有这些内容3√√√√×4√√×5√√√√6√√√√7√√√
(9)互连网络
表7
编号内容【郑】【李】【白】【尹】【周】1基本概念√√√√√2互连函数√√√√√3互连网络的特性参数√√√√√4静态互连网络√√√√5动态互连网络(含多级互连网络)√√√√√6消息传递机制√√√7互连网络举例√√√√√
表7(续)
编号【徐】【陈】【田】【张2】【张】【H3】要否说明1注7-1√有"互连网络"一节.内容比较简单√√注7-2√2√√√√3√√√4√√√√5√√√√6√√7√√√√注7-1:【徐】中的内容比较少,只简单地介绍了单级互连网络和多级互连网络,并且是放在并行处理机这一节中.
注7-2:与国内的教材不同,【H3】从网络的角度来论述互连网络,介绍了互连网络的媒介,网络拓扑结构,互连网络举例等.内容多而杂.我们认为不如国内的教材写得好.在其最新版【Henn4】中,他们也取消了这部分内容.
(10)阵列处理机
关于这部分内容,大多数国内教材都单独列一章.只是有的书是把这一章称为阵列处理机(如【李】),有的是把它称为SIMD计算机(如【郑】,【尹】),有的将之称为并行处理机(如【周】,【徐】).我们认为采用阵列处理机这个名称更合适.
表8
编号内容【郑】【李】【白】【尹】【周】1阵列处理机的操作模型√√2阵列处理机的结构和特点√√√√√3阵列处理机的并行算法√√√√√4阵列处理机实例ILLIAC-Ⅳ,BSP,CM-2,MP-1ILLIAC-ⅣILLIAC-Ⅳ,MP-1ILLIAC-Ⅳ,BSPILLIAC-Ⅳ,BSP,MP-1
表8(续)
编号【徐】【陈】【田】【张2】【张】【H3】要否说明1无此
内容√无此
内容无此
内容√2√√√√3√√√√4ILLIAC-ⅣILLIAC-Ⅳ,BSPILLIAC-Ⅳ,BSPILLIAC-Ⅳ,BSP注8-1注8-1:可以看出,ILLIAC-Ⅳ和BSP是被采用最多的阵列处理机实例.
(11)多处理机
大部分国内教材的这一部分内容显得比较陈旧,所以我们将主要参照【H3】的框架来组织内容.多处理机Cache一致性,同步,同时多线程等将是主要的内容.
表9
编号内容【郑】【李】【白】【尹】【周】1对称式共享存储器系统结构√注9-1√√√2分布式共享存储器系统结构√√√√3多处理机Cache一致性:监听协议√√√√4多处理机Cache一致性:目录协议√√√√5同步√6同时多线程7多处理机实例CM-5,Origin2000CrayT3D,Origin2000SGIChallenge,Origin2000
表9(续)
编号【徐】【陈】【田】【张2】【张】【H3】要否说明1注9-2注9-3√注9-4√√√2√√√√3√√√√4√√√√5√√√6√√√7Cm*,CmmpCM-5,T3E,Origin2000Origin2000Origin2000Wildfire,Origin2000Origin2000,SunT1注9-5注9-1:【李】中只介绍了多处理器的硬件结构(包括机间互连,存储器的组织),并行算法,程序并行性分析,并行语言,多处理机的操作系统等,对表9中所列的比较重要的内容没有介绍.对多Cache一致性的介绍也很简单,篇幅只有两页.这一章的内容框架显得比较陈旧.
注9-2:【徐】中的内容与【李】中的内容相近.
注9-3:【陈】中的内容也与【李】中的内容相近.不过,【陈】对于MPP进行了比较详细的介绍.
注9-4:【张2】论述了多处理机的系统结构模型,互连结构,存储器组成等.对多Cache一致性有一定的介绍,但深度不够.【张2】还介绍了并行算法,并行程序设计语言等,这与【李】中相应的部分内容接近.
注9-5:Cm*,Cmmp是比较早的实例了.Origin2000是被采用最多的实例,而SunT1则是2005年由Sun公司作为服务器引入市场的新的多处理机,【H4】选用了SunT1作为其实例.我们选用Origin2000和SunT1作为实例.
(12)机群计算机
这部分内容相对较新,因为机群系统是20世纪90年代才出现的.在过去的10年中,全球高性能计算机500强(Top500)排名中机群系统的数量逐年攀升,从1997年的1台增加至2006年的364台,占据500强中的72.8%.由此可见这部分内容的重要性.
表10
编号内容【郑】【李】【白】【尹】【周】1基本概念√无此内容√√只有两页
的篇幅2机群的特点√√√3机群的分类√√续表
编号内容【郑】【李】【白】【尹】【周】4机群的通信技术√5并行程序设计环境√6机群的负载平衡技术√7机群系统实例注10-1IBMSP2
表10(续)
编号【徐】【陈】【田】【张2】【张】【H3】要否说明1√√√√无此内容√√2√√√√√3√√√4√√√√5√√√√√6√√7自强20004个例子BerkeleyNOW,
IBMSP2注10-1:【郑】有提到几个系统,包括BerkeleyNow,但没有进一步的介绍.
(13)数据流计算机
虽然数据流计算机的思想是早在1972年就提出的,到现在也没有被广泛采用,但由于它采用的数据驱动与传统的冯·诺依曼计算机(控制驱动)根本不同,所以一直被认为是非冯·诺依曼计算机的经典结构.我们认为,这部分内容也是系统结构的经典内容,应该纳入到本方案中.
表11
编号内容【郑】【李】【白】【尹】【周】1基本概念和基本原理√√无此内容无此内容无此内容2数据流计算机模型√3数据流程序图和数据流语言√√4静态数据流计算机结构√√5动态数据流计算机结构√√
本文是一篇系统结构论文范文,系统结构类硕士毕业论文,关于计算机绘图相关在职研究生毕业论文范文。适合系统结构及计算机及计算机系统结构方面的的大学硕士和本科毕业论文以及系统结构相关开题报告范文和职称论文写作参考文献资料下载。
6其他类型的数据流计算机√表11(续)
编号【徐】【陈】【田】【张2】【张】【H3】要否说明1√√无此内容√无此内容无此内容√2√√√3√√√√4√√√√5√√√√6×
(14)数据库机,知识库机,归约机等
从表12可以看出,大部分教材都没有这方面的内容.
智能机,知识库机,归约机等是面向人工智能应用的专用计算机.它们是在20世纪80年代日本狂热地鼓吹第五代计算机开始流行的.随着那阵狂潮的退去,它们已经逐渐淡化,几乎从人们的视线中消失.
数据库机,脉动阵列机,相联处理机也属于专用计算机,使用得很少.
按照本方案重点讲述最有用,使用最广泛的结构和原理的原则,我们决定放弃这部分内容.
表12
编号内容【郑】【李】【白】【尹】【周】1数据库机√无此
内容无此
内容无此
内容2知识库机√3智能机√4归约机√√5脉动阵列机√6相联处理机√
表12(续)
编号【徐】【陈】【田】【张2】【张】【H3】要否说明1无此
内容√无此
内容
无此内容无此内容×2√×3√×4√×5√√×6×
(15)部分教材的特色(内容)
【郑】共有731页,内容丰富,是一本大而全的书.该书是国内比较经典的一本系统结构教材.但对于本科生来说,内容太多,书太厚.作为系统结构参考书倒是非常好.该书第2版是1998年出的,部分内容显得有些过时.
【李】也是国内比较经典的一本系统结构教材.之所以称它为经典,主要是因为其前身是苏东庄编写的系统结构教材.25年前我们上大学时就使用过.
【白】是网络版,只有200页.但该教材框架清晰,重点突出,语言简练.
【张】借鉴了【H3】的讲法和内容,内容比较新.但缺少数据流计算机等一些经典内容和机群计算机的内容.
【徐】中有这样一章:"分布计算环境结构",这是所有上述教材中所没有的.另外,该书的第二章为"计算机系统结构",讲述的内容包括:CPU组成,数据表示,寻址方式,指令优化,总线结构,存储系统概述,输入输出等内容.相当于给系统结构的方方面面来个概述.这也是所有其他教材中所没有的.我们不采用这种写法.
4课程内容体系
在上述对国内外系统结构教材分析和研究的基础上,我们确定了系统结构课程的内容体系,如下所示.
第1章绪论
1.1引言
1.2计算机系统结构的概念
1.3计算机系统的性能评测
1.4计算机系统结构的发展
1.5并行性的发展
第2章计算机指令系统的设计
2.1指令系统的分类
2.2寻址方式
2.3指令系统的功能设计(包括RISC和CISC)
2.4指令格式的优化设计
2.5MIPS指令系统
第3章流水线技术
3.1重叠执行和先行控制
3.2流水线的基本概念
3.3流水线的性能分析
3.4非线性流水线的调度
3.5流水线的相关与冲突
3.6流水线的实现
(以MIPS流水线为例)
第4章向量处理机
4.1向量处理方式
4.2向量处理机的结构
4.3提高向量处理机性能的方法
4.4向量处理机的性能评价
4.5向量处理机实例(Cray-1,CrayY-MP和C90)
第5章指令级并行性及其开发——硬件方法
5.1指令级并行的概念
5.2指令的动态调度
(包括记分牌算法和Tomasulo算法)
5.3动态分支预测技术
5.4基于硬件的前瞻执行
5.5多指令流出技术(包括超标量,超长指令字,超流水技术)
第6章指令级并行性的开发——软件方法
6.1循环展开和基本指令调度
6.2跨越基本块的静态指令调度
6.3静态多指令流出:VLIW技术
6.4显式指令并行执行EPIC
6.5开发更多的指令级并行
6.6实例:IntelItanium处理器
第7章存储器系统
7.1存储器的层次结构
7.2Cache的地址映像与地址变换
7.3降低Cache失效率的方法
7.4减少Cache失效开销的方法
7.5减少命中时间的方法
(包括虚拟Cache等)
7.6并行主存
7.7虚拟存储器(简单)
7.8存储层次实例
第8章输入输出系统
8.1I/O系统性能与CPU性能
8.2I/O系统的可靠性,可用性和可信性
8.3廉价磁盘冗余阵列RAID
8.4通道处理机
8.5I/O与操作系统
第9章互连网络
9.1互连网络的基本概念
(包括互连函数和互连网络的特性参数)
9.2静态互连网络
9.3动态互连网络(包括互连网络的例子)
9.4消息传递机制
第10章多处理机
10.1引言
10.2对称式共享存储器系统结构
(包括监听法多Cache一致性协议及其实现)
10.3分布式共享存储器系统结构
(包括目录法多Cache一致性协议及其实现)
10.4同步
10.5同时多线程
10.6多处理机实例(Origin2000,SunT1)
第11章机群计算机
11.1机群的基本概念和结构
11.2机群的特点
11.3机群的分类
11.4机群的通信技术
11.5并行程序设计环境
11.6机群的负载平衡技术
11.7机群系统实例(包括BerkeleyNOW和IBMSP2)
第12章阵列处理机
12.1阵列处理机的操作模型
12.2阵列处理机的结构和特点
12.3阵列处理机的并行算法
12.4阵列处理机实例(包括ILLIAC-Ⅳ和BSP)
第13章数据流计算机
13.1数据流计算机的基本原理
13.2数据流计算机模型
13.3数据流程序图和数据流语言
13.4静态数据流计算机结构
13.5动态数据流计算机结构
5实践教学
本课程的实践教学在国内一直是一个难题,大多数学校的该课程都没能开设实验.其主要原因有两个:一是目前国内尚无出版的系统结构实验的教材,另一个是做系统结构实验的硬件复杂,成本高.我们认为,本课程强调从系统级的层次来研究计算机系统,因此可以不必都在专门的硬件平台上做实验,而且不见得采用了硬件就能达到好效果.在虚拟机上做实验和进行软件模拟也可以达到主要目的,而且可以节省实验室的投入,灵活性也比较大.国外甚至有研究结果表明,用模拟器做实验效果更好.
利用模拟器,通过执行程序,跟踪和观察机器的工作情况和发生的变化,并进行数据统计和性能分析,学生可以对相关的概念,原理和方法等有更透彻的理解和掌握,可以通过数据统计和性能分析更具体地理解各种提高性能的方法是如何影响计算机系统性能的.有的模拟器提供对目标机(被模拟的机器)的配置进行设置和修改的功能,能模拟在不同设置情况下执行程序的过程,以便于做对比实验.
目前国际上比较流行的适合于教学的模拟器有:WinDLX,DLXView,SimpleScalar,PCache等.其中WinDLX和PCache是在Windows操作系统上运行的模拟器,使用比较方便,而DLXView和SimpleScalar是在Linux上运行的,比较麻烦.
经过试用和分析,我们发现,除WinDLX比较好用外,其他几个都不是很好用,学生做实验时,往往会被模拟器的运行操作问题所困扰.而且这些模拟器都是国外的,受版权问题的限制,不可能放到我们的实践教程教材所附带的光盘中.因此,我们希望开发有自主版权,基于Windows的更好用的模拟器,现正在争取经费立项.
实验一流水线中的相关
使用我们自己开发的MIPS模拟器或WinDLX模拟器
实验二循环展开及指令调度
使用我们自己开发的MIPS模拟器或WinDLX模拟器
实验三Tomasulo算法
使用我们自己开发的Tomasulo算法模拟器
实验四单机Cache性能分析
使用我们自己开发的Cache模拟器模拟器
14
高等学校计算机课程群研究报告汇编
15
计算机系统结构课程内容体系及实践课程研究报告