《C陷阱与缺陷》——第三章(语义陷阱)

x33g5p2x  于2021-11-21 转载在 其他  
字(2.9k)|赞(0)|评价(0)|浏览(353)

一、指针与数组

C语言中数组值得注意的地方有以下两点:
1.C语言中只有一维数组,而且数组的大小必须在编译期就作为一个常数确定下来。然而,C语言中数组的元素可以是任何类型的对象,当然也可以是一个数组。这样,”仿真“出一个多维数组就不是一件难事。
(注:C99标准允许变长数组(VLA)。GCC编译器中实现了变长数组,但细节与C99标准不完全一致。)
2.对于一个数组,我们只能够做两件事:确定数组大小,以及获得指向该数组下标为0的元素的指针。其他有关数组的操作,实际上都是通过指针进行的。

给指针加上一个整数,如p+1,则p指向下一内存中的数据,而给指针的二进制表示(指针指向的地址)加上同样的整数,实际上是将p指向的地址+1,效果不一样。

如果两个指针指向的是同一个数组中的元素,我们可以把这两个指针相减。若两个指针指向的是不同数组中的元素,即使它们指向的地址在内存中位置正好间隔一个数组元素的整数倍,所得的结果仍然无法保证其正确性。

数组命除了被用作sizeof的参数这一情况外,其他所有情况下数组命都代表指向数组a中下标为0的元素的指针。

二维数组遍历代码如下:

  1. int i[12][31];
  2. int (*p)[31];
  3. for (p = i; p < &i[12]; p++)
  4. {
  5. int *dp;
  6. for(dp = *p; dp < &(*p)[31]; dp++)
  7. {
  8. *dp = 0;
  9. }
  10. }

二、非数组指针

在使用内存分配函数(malloc)的时候,需要注意的是,如果分配字符串空间,一定要注意’\0’字符,该字符在使用strlen函数求字符串长度的时候会被忽略。使用malloc函数对应的内存用完要使用free函数释放内存。
示例代码如下:

  1. char *r;
  2. char s[] = "Hello";
  3. char t[] = "World!";
  4. r = malloc(strlen(s) + strlen(t) + 1);
  5. if (r != NULL)
  6. {
  7. strcpy(r, s);
  8. strcat(r, t);
  9. }
  10. printf("%s\n", r );
  11. free(r);

三、作为参数的数组声明

C语言会自动将作为参数的数组声明转换为相应的指针声明。
例子1:

  1. int strlen(char s[])
  2. {
  3. }

与下面的写法完全相同

  1. int strlen(char* s)
  2. {
  3. }

指针并不是所有情况下都指向数组首地址。
例子2:

  1. extern char* hello;

  1. extern char hello[];

前者只声明了一个字符型指针,而后者声明了字符数组,二者代表的概念不一样。

四、避免“举隅法”

”举隅法“是文学修辞上的手段,以隐喻表示代指物与被指物的相互关系。《牛津英语词典》对”举隅法“(synecdoche)的解释是:以含义更宽泛的词语来代替含义相对较窄的词语,或者相反。

C语言中的一个常见陷阱:混淆指针与指针所指向的数据。
复制指针并不同时复制指针所指向的数据,它们指向的空间相同,而两个数组才指向的是两块不同的空间。

五、空指针并非空字符串

C语言中将一个整数转换为一个指针,最后得到的结果取决于具体的C编译器实现。存在一个特殊情况0,编译器保证由0转换而来的指针不等于任何有效指针。不能使用空指针所指向的内存中存储的内容。

  1. char *p;
  2. // p = (char*)3;
  3. // p = NULL;
  4. p = (char*)0;
  5. printf("%s\n", p); //未定义行为
  6. // printf("%d\n", p); //打印出具体数字

六、边界计算与不对称边界

此处存在”栏杆错误“,也常被称为”差一错误“(off-by-one error)
避免”差一错误“的两个通用原则:
1.首先考虑最简单情况下的特例,然后将得到的结果外推
2.仔细计算边界,绝不掉以轻心

例子1:

  1. static char buffer[N];
  2. static char *bufptr;
  3. char* clearbuffer(char* source);
  4. void bufferwrite(char* source, int len)
  5. {
  6. char* data = source;
  7. while (len > 0)
  8. {
  9. // if (N - (&buffer[N] - bufptr) < N)
  10. // {
  11. // *bufptr++ = *data++;
  12. // len--;
  13. // }
  14. // else
  15. // {
  16. // bufptr = clearbuffer(buffer);
  17. // }
  18. if (bufptr == &buffer[N])
  19. {
  20. int l = sizeof(buffer);
  21. bufptr = clearbuffer(buffer);
  22. }
  23. else
  24. {
  25. int k, rem;
  26. rem = N - (bufptr - buffer);
  27. k = len > rem? rem:len;
  28. memcpy(bufptr, data, k);
  29. bufptr += k;
  30. data += k;
  31. len -= k;
  32. }
  33. }
  34. }
  35. char* clearbuffer(char* source)
  36. {
  37. memset(source, 0, N);
  38. return source;
  39. }

七、求值顺序

C语言中只有”&&“、”||“、”? :“、”,“四个运算符,存在规定的求值顺序。
”&&“运算符和”||“运算符首先对左操作数求值,只在需要时才对右操作数求值。

运算符”? :“有三个操作数:在a?b:c中,操作数a首先被求值,根据a的值再求操作数b或者操作数c的值。

逗号操作符首先对左操作符求值,然后该值被”丢弃“,再对右操作数求值。
(注:分隔函数参数的逗号并非逗号运算符。例如,x和y在函数f(x,y)中的求值顺序是未定义的,而在函数g((x,y))中是确定的,先求x后求y。在后一个例子中,函数g只有一个参数,这个参数的值是这样求到的,先求x的值,然后x的值被”抛弃“,接着求y的值。)

C语言中其他所有运算符对其操作数求值的顺序是未定义的,特别地,赋值运算符并不保证任何求值顺序。

八、运算符&& || 和!

C语言中有两类逻辑运算符,某些时候可以互换:按位运算符& |和~。以及逻辑运算符&& ||和!。
逻辑运算符&&和||在左侧操作数的值能够确定最终结果时根本不会对右侧操作数求值。运算符&左右两边的操作数都必须被求值。

九、整数溢出

C语言中存在两类整数运算,有符号运算与无符号运算。在无符号运算中,没有所谓的”溢出“一说。所有无符号运算都是以2的n次方为模,这里n是结果中的位数。如果超出表示范围,则从0开始继续运算。
如果算术运算符的一个操作数是有符号整数,另一个操作数是无符号整数,那么有符号整数会被转换成无符号整数,”溢出“也不可能发生。
当两个操作数都是有符号整数时,”溢出“就有可能发生,而且”溢出“的结果是未定义的。

十、为函数main提供返回值

函数如果未显示声明返回类型,那么函数返回类型的默认类型是整型。
main函数的返回值在不使用的情况下无关紧要,如果返回值表示函数是否执行成功,则需要明确具体的返回值,不能不写返回值,否则有可能系统会判断函数执行失败。

相关文章