循环展开

循环展开（Loop unwinding或loop unrolling），是一种牺牲程序的大小来加快程序执行速度的优化方法。可以由程序员完成，也可由编译器自动优化完成。

循环展开最常用来降低循环开销，为具有多个功能单元的处理器提供指令级并行。也有利于指令流水线的调度。

例子

for (i = 1; i <= 60; i++) 
   a[i] = a[i] * b + c;

可以如此循环展开：

for (i = 1; i <= 58; i+=3)
{
  a[i] = a[i] * b + c;
  a[i+1] = a[i+1] * b + c;
  a[i+2] = a[i+2] * b + c;
}

这被称为展开了两次。

优点

分支预测失败减少。
如果循环結構内语句没有数据相关，增加了并发执行的机会。
可以在执行时动态循环展开。这种情况在编译时也不可能掌握。

缺点

代码膨胀
代码可读性降低，除非是编译器透明执行循环展开。
循环結構内包含递归可能会降低循环展开的效益。^[1]

进一步阅读

Kennedy, Ken; Allen, Randy. Optimizing Compilers for Modern Architectures: A Dependence-based Approach. Morgan Kaufmann. 2001. ISBN 1-55860-286-0.

参考文献

^ Adam Horvath "Code unwinding - performance is far away" （页面存档备份，存于互联网档案馆）

外部链接

Chapter 7, pages 8 to 10, of Michael Abrash's Graphics Programming Black Book is about loop unrolling, with an example in x86 assembly.
[1] （页面存档备份，存于互联网档案馆） Generalized Loop Unrolling, gives a concise introduction.

[1] Adam Horvath "Code unwinding - performance is far away" （页面存档备份，存于互联网档案馆）

[1]

查论编编译器优化
基本塊	窥孔优化
循环优化（英语：Loop optimization）	归纳变量（英语：Induction variable）強度折減循环合并（英语：Loop fusion）循环反演（英语：Loop inversion）循环交换（英语：Loop interchange）循环不变代码外提循环嵌套优化（英语：Loop nest optimization）循环展开循环分割（英语：Loop splitting）迴圈判斷外提软件流水（英语：Software pipelining）自动并行化（英语：Automatic parallelization）
数据流分析	公共子表达式消除常數折疊归纳变量识别和消除（英语：Induction variable recognition and elimination）无作用储存体（英语：Dead store）消除用户定义链（英语：Use-define chain）活跃变量分析（英语：Live variable analysis）可用表达式（英语：Available expression）
基于SSA的优化	全局值编号（英语：Global value numbering）稀疏有條件的常數傳播
代码生成	暫存器配置指令选择指令调度再具体化
函数	尾调用消除去森林化（英语：Deforestation (computer science)）
全局	过程间优化（英语：Interprocedural optimization）
其他	边界检查消除（英语：Bounds-checking elimination）编译时函数执行（英语：Compile-time function execution）死碼刪除内联展开跳转线程（英语：Jump threading）
静态分析	别名分析指针分析（英语：Pointer analysis）形状分析（英语：Shape analysis (program analysis)）逃逸分析数组访问分析（英语：Array access analysis）依赖分析（英语：Dependence analysis）控制流分析数据流分析