Linux利用多核多线程进行程序优化

系统教程840 更新时间：2026-04-10 01:57:25

2024年6月1日发(作者：)

利用多核多线程进行程序优化

简介：大家也许还记得 2005 年 3 月 C++ 大师 Herb Sutter 在’s Journal 上发表了一篇名为

《免费的午餐已经结束》的文章。文章指出：现在的程序员对效率、伸缩性、吞吐量等一系列性能指标相

当忽视，很多性能问题都仰仗越来越快的 CPU 来解决。但 CPU 的速度在不久的将来，即将偏离摩尔定

律的轨迹，并达到一定的极限。所以，越来越多的应用程序将不得不直面性能问题，而解决这些问题的办

法就是采用并发编程技术。

样例程序

程序功能：求从1一直到

APPLE_MAX_VALUE (100000000)

相加累计的和，并赋

值给 apple 的

a

和

b

；求 orange 数据结构中的 a[i]+b[i ] 的和，循

环

ORANGE_MAX_VALUE

(1000000)

次。

说明：

1. 由于样例程序是从实际应用中抽象出来的模型，所以本文不会进行test.a=test.b=

test.b+sum、中间变量(查找表)等类似的优化。

2. 以下所有程序片断均为部分代码，完整代码请参看本文最下面的附件。

清单 1. 样例程序

#define ORANGE_MAX_VALUE 1000000

#define APPLE_MAX_VALUE 100000000

#define MSECOND 1000000

struct apple

{

unsigned long long a;

};

struct orange

{

};

int main (intargc, const char * argv[]) {

// insert

struct apple test;

struct orange test1;

for(sum=0;sum

int a[ORANGE_MAX_VALUE];

int b[ORANGE_MAX_VALUE];

unsigned long long b;

{

}

test.a += sum;

test.b += sum;

sum=0;

return 0;

}

for(index=0;index

{

}

sum += test1.a[index]+test1.b[index];

回页首

K-Best 测量方法

在检测程序运行时间这个复杂问题上，将采用 Randal 和 David R. O’Hallaron提

出的 K 次最优测量方法。假设重复的执行一个程序，并纪录 K 次最快的时间，如果发现

测量的误差 ε 很小，那么用测量的最快值表示过程的真正执行时间，称这种方法为“ K 次

最优（K-Best）方法”，要求设置三个参数：

K: 要求在某个接近最快值范围内的测量值数量。

ε 测量值必须多大程度的接近，即测量值按照升序标号 V1, V2, V3, … , Vi, … ，同时必须

满足（1+ ε）Vi >= Vk

M: 在结束测试之前，测量值的最大数量。

按照升序的方式维护一个 K 个最快时间的数组，对于每一个新的测量值，如果比当前 K 处

的值更快，则用最新的值替换数组中的元素 K ，然后再进行升序排序，持续不断的进行该

过程，并满足误差标准，此时就称测量值已经收敛。如果 M 次后，不能满足误差标准，则

称为不能收敛。

在接下来的所有试验中，采用 K=10，ε=2%，M=200 来获取程序运行时间，同时也对 K 次

最优测量方法进行了改进，不是采用最小值来表示程序执行的时间，而是采用 K 次测量值

的平均值来表示程序的真正运行时间。由于采用的误差 ε 比较大，在所有试验程序的时间

收集过程中，均能收敛，但也能说明问题。

为了可移植性，采用gettimeofday() 来获取系统时钟（system clock）时间，可以精确到微

秒。

回页首

测试环境

硬件：联想 Dual-core 双核机器，主频 2.4G，内存 2G

软件：SuseLinunx Enterprise 10，内核版本：linux-2.6.16

回页首

软件优化的三个层次

本文发布于:2024-06-01，感谢您对本站的认可！

本文链接:https://www.fzithome.com/xitong/1717246903a639795.html

Linux利用多核多线程进行程序优化

发布评论取消回复

最近发表

相关推荐

标签列表

Linux利用多核多线程进行程序优化

发布评论 取消回复

最近发表

相关推荐

标签列表

发布评论取消回复