在我的程序中,我有一个简单的向量加法函数c[0:15] = a[0:15] + b[0:15]
。函数原型是:
void vecadd(float * restrict a, float * restrict b, float * restrict c);
字符串
在我们的32位嵌入式架构中,有一个加载/存储双字的加载/存储选项,如:
r16 = 0x4000 ;
strd r0,[r16] ; stores r0 in [0x4000] and r1 in [0x4004]
型
GCC优化器识别循环的向量性质,并生成代码的两个分支-一个用于3个数组是双字对齐的情况(因此它使用双加载/存储指令),另一个用于数组是字对齐的情况(其中它使用单加载/存储选项)。
问题是地址对齐检查相对于加法部分来说开销很大,我想通过提示编译器a,b和c总是8对齐来消除它。是否有一个修饰符添加到指针声明中以告诉编译器这一点?
用于调用此函数的数组具有aligned(8)属性,但它没有反映在函数代码本身中。是否可以将此属性添加到函数参数中?
6条答案
按热度按时间xdnvmnnf1#
如果属性不起作用,或者没有选择....
我不确定,但试试这个:
字符串
这应该告诉GCC指针是对齐的。从这一点来看,它是否做你想要的取决于编译器是否能有效地使用这些信息;它可能不够聪明:这些优化并不容易。
另一种选择可能是将浮点数 Package 在一个必须8字节对齐的联合体中:
型
我认为应该强制8字节对齐,但同样,我不知道编译器是否足够聪明,可以使用它。
j5fpnvbx2#
根据我在系统上找到的一段示例代码,我尝试了以下解决方案,它结合了前面给出的一些答案的想法:基本上,创建一个具有64位类型的浮点数小数组的联合-在本例中是浮点数的SIMD向量-并使用操作数浮点数数组的强制转换调用函数:
字符串
现在编译器不生成4对齐的分支。
然而,
__builtin_assume_aligned()
将是更可取的解决方案,防止演员和可能的副作用,如果它只工作.编辑:我注意到,内置函数在我们的实现中实际上是有缺陷的(即,它不仅不工作,而且会导致代码后面的计算错误。
lp0sw83n3#
如何告诉GCC指针参数总是双字对齐?
看起来较新版本的GCC有
__builtin_assume_aligned
:内置函数:
void * __builtin_assume_aligned (const void *exp, size_t align, ...)
这个函数返回它的第一个参数,并允许编译器假设返回的指针至少是对齐字节对齐的。这个内置的可以有两个或三个参数,如果它有三个,第三个参数应该是整数类型,如果它是非零的,则表示未对齐偏移量。例如:
字符串
意味着编译器可以假设x(设置为arg)至少是16字节对齐的,而:
型
这意味着编译器可以假设x(设置为arg),(char *)x - 8是32字节对齐的。
根据2010年左右Stack Overflow上的一些其他问题和答案,似乎内置的在GCC 3和早期的GCC 4中不可用。但我不知道分界点在哪里。
bmp9r5qi4#
对方式规范通常只适用于小于指针基类型的对方式,而不适用于大于指针基类型的对方式。
我认为最简单的方法是用对齐规范声明整个数组,
字符串
(The语法可能不正确,我总是很难知道把这些
__attribute__
放在哪里)并在整个代码中使用该类型。
型
这给了你一个额外的间接,但这只是语法。像
*a
只是一个noop,只把指针重新解释为指向第一个元素的指针。axr492tv5#
gcc版本在简单类型定义和数组上的align()是不可靠的。通常要做你想做的事情,你必须把浮点数 Package 在一个结构体中,并让包含的浮点数有对齐限制。
使用运算符重载,你几乎可以轻松地做到这一点,但它确实假设你可以使用c++语法。
字符串
kninwzqo6#
我从来没有使用过它,但有*** 属性 *((aligned(8)**
如果我正确阅读了文档,那么它是这样使用的:
字符串
见http://ohse.de/uwe/articles/gcc-attributes.html#type-aligned