中国安防论坛

 找回密码
 注册
查看: 3164|回复: 5

[讨论]请教:x86架构是指什么?

[复制链接]

安防幼儿园学生

Rank: 1

积分
7
发表于 2004-2-10 22:24:14 | 显示全部楼层 |阅读模式
请教:x86架构是指什么? 先谢过了
mars

安防偶像

Rank: 7Rank: 7Rank: 7

积分
1913
QQ
发表于 2004-2-10 22:33:43 | 显示全部楼层

Re:[讨论]请教:x86架构是指什么?

英特尔推出X86架构已满20年了,同486相比,Pentium向前迈进了一大步, 而PⅡ的前进步伐则没有这么大了,X86 CPU的发展似乎已到了尽头。     英特尔非常清楚,是X86指令集限制了CPU性能的进一步提高,因此,他们正同惠普一道努力开发下一代指令集架构(Instruction Set Architecture ,ISA): EPIC(Explicitly Parallel Instruction Computing,显性并行指令计算)。对英特尔而言, IA-64(英特尔的64位架构)是下一个10到15年的架构。新的ISA将使英特尔摆脱X86架构的限制,从而设计出超越所有现有RISC CPU和X86 CPU的新型处理器。那么EPIC的先进之处在什么地方呢?为什么英特尔会放弃使它成为芯片巨人的X86架构呢?     一、IA-32的问题     我们知道,工程师可以通过提高每个时钟的指令执行数来提高性能,英特尔新的指令集的首要目的在于,让指令更容易解码,更容易并行执行。这样就可以不受限制地开发新型处理器。     但是,对工程师而言,兼容8086的X86指令集一直是必须完成的任务。毕竟,兼容前代产品是使英特尔成长壮大起来的关键因素,而且还可以保护用户原先的投资和使用数以百万计应用软件。既然如此,为什么又要放弃整个X86指令集重新开始呢?X86的不足在什么地方?     (1)可变的指令长度     X86指令的长度是不定的,而且有几种不同的格式,结果造成X86 CPU的解码工作非常复杂,为了提高CPU的工作频率,不得不延长CPU中的流水线,而过长的流水线在分支预测出错的情况下,又会带来CPU工作停滞时间较长的弊端。     (2)寄存器的贫乏     X86指令集架构只有8个通用寄存器,而且实际只能使用6个。这种情况同现代的超标量CPU极不适应,虽然工程师们采用寄存器重命名的技术来弥补这个缺陷,但造成了CPU过于复杂,流水线过长的局面。     (3)内存访问     X86指令可访问内存地址,而现代RISC CPU则使用LOAD/STORE模式,只有LOAD和STORE指令才能从内存中读取数据到寄存器,所有其他指令只对寄存器中的操作数计算。在目前CPU的速度是内存速度的5倍或5倍以上的情况下,后一种工作模式才是正途。     (4)浮点堆栈     X87 FPU是目前最慢的FPU,主要的原因之一就在于X87指令使用一个操作数堆栈。如果没有足够多的寄存器进行计算,你就不得不使用堆栈来存放数据,这会浪费大量的时间来使用FXCH指令(即把正确的数据放到堆栈的顶部)。     (5)4GB限制     这似乎不是问题,但是,在6年前,主流PC只有4MB内存,而目前的绝大部分PC装备了64MB以上的内存,是以前的16倍,所以,在下一个十年,PC内存突破1GB绝对不会令人惊讶,而且目前的大型服务器已经使用了1GB以上的内存,突破4GB内存的情况很快就会出现。     (6)芯片变大     所有用于提高X86 CPU性能的方法,如寄存器重命名、巨大的缓冲器、乱序执行、分支预测、X86指令转化等等,都使CPU的芯片面积变得更大,也限制了工作频率的进一步提高,而额外集成的这些晶体管都只是为了解决X86指令的问题。     二、下一代指令集:IA-64     Merced是第一款使用IA-64的处理器,这款CPU具有64位寻址能力和64位宽的寄存器,所以我们称它为64位CPU。由于具有64位寻址能力,它能够使用1百万TB的地址空间,足以运算企业级任务;64位宽的寄存器可以使Merced 达到非常高的精度。     粗看起来,Merced很像其他的64位RISC CPU:指令的长度是固定的,由一个指令、两个输入和一个输出寄存器组成;指令只对寄存器操作;超标量,具有多个不同的流水线或执行单元,能够并行执行许多指令。那么,Merced的不同点在哪里呢?     (1)显性并行性     尽可能并行工作是提高CPU性能的最佳方法,如果你的CPU每个时钟周期可以执行8个指令,而竞争对手的CPU每个时钟周期只能执行4个指令,那么,他只能制造一个时钟频率是2倍于你的CPU,才能在速度上赶上你。     我们知道,程序分支和指令依赖是造成难以并行执行许多指令的障碍,而Merced采用的方法是让编译器告诉CPU哪些指令可以一起发布并执行。Merced 接收来自于编译器的128位包,每个包含有3个40位指令和1个8位模板。每个指令又由3个7位寄存器地址(即可以使用2^7=128个寄存器)、一个6位预测寄存器和13位指令代码,其中,最有趣的莫过于模板。     这个8位模板包含了不同指令间的并行信息,编译器将使用模板告诉CPU,哪些指令可以同时发布。模板也包含了包的结束位,用以告诉CPU这个包是否结束,CPU是否需准备捆绑下两个或更多的包。现在你明白为什么EPIC CPU的马力如此强劲了吧,高端CPU可以一起执行几个包。由于IA-64架构的64个通用寄存器和64个浮点寄存器(编注:原文如此),使CPU可以同时发布许多指令。     当然,强悍的EPIC CPU也需要一个强悍的编译器,编译器的工作是检查指令依赖情况,把并行指令放在一起,并重新排序,使执行单元可以很顺畅地工作。     (2)分支预测     在现代CPU中,分支预测的正确率可以达到90%~95%,虽然看起来还不坏, 但当预测出错时,CPU就不得不清洗整条流水线
现在研究高清IPC,欢迎探讨QQ
回复

使用道具 举报

安防幼儿园学生

Rank: 1

积分
23
发表于 2004-7-22 19:06:57 | 显示全部楼层

re:很专业!

很专业!
回复

使用道具 举报

安防小学生

Rank: 2

积分
85
QQ
发表于 2004-7-24 18:15:11 | 显示全部楼层

re:老大回答的还会有不专业?

老大回答的还会有不专业?
回复

使用道具 举报

安防幼儿园学生

Rank: 1

积分
4
发表于 2004-7-24 18:33:59 | 显示全部楼层

re:哦!!对PC的发展满清楚地噢,是不是搞I...

哦!!对PC的发展满清楚地噢,是不是搞IT地呀?
回复

使用道具 举报

安防工作者

Rank: 3Rank: 3

积分
367
发表于 2004-7-24 18:41:26 | 显示全部楼层

re:顶

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

安豆网|Archiver|手机版|中国安防论坛 ( 粤ICP备09063021号 )

GMT+8, 2024-5-22 11:39 , Processed in 0.080802 second(s), 25 queries .

Powered by Discuz! X3.4 Licensed

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表