C语言中跨文件的全局变量

首先看一段代码

func.c

int buf = 0;

void func() {
  buf = 2;
  /* Do something else */
}

main.c

#include <stdio.h>

int buf;
void func();

int main() {
  buf = 1;
  func();
  printf("%d\n", buf);
  return 0;
}

编译两个文件,输出的结果是怎样的呢?一眼看上去,可能会输出1,因为两个全局变量buf在不同文件中,又没有extern声明,显然是两个嘛。然而实际上它的运行结果却是2,这说明了这两个文件中引用到的其实是一个变量!

这是为什么呢?原因是在编译时,C语言编译器将全局符号标记为strong和weak两类:

  • 函数和初始化的全局符号被标记为strong
  • 未初始化的全局符号被标记为weak

连接时,连接器对多重定义的全局符号的解析原则如下:

  • 同一个符号不允许有多个strong定义;
  • 假如一个符号有一个strong定义和多个weak定义,那么采用该符号的strong定义;
  • 假如一个符号有多个weak定义,那么选取任意一个weak定义

由于两个变量一个初始化了,一个没有初始化,所以一个是strong,一个是weak,所以连接器在符号解析时会把他们当成一个。

如果我们把main.c中的buf也初始化了:

#include <stdio.h>

int buf = 0;
void func();

int main() {
  buf = 1;
  func();
  printf("%d\n", buf);
  return 0;
}

再次编译就会发现

duplicate symbol _buf in:
    /var/folders/44/_cc501qx1jd1p5bfrjbk6b100000gn/T//ccZ87C6g.o
    /var/folders/44/_cc501qx1jd1p5bfrjbk6b100000gn/T//ccZlES8n.o
ld: 1 duplicate symbol for architecture x86_64
collect2: ld returned 1 exit status

这是因为两个全局变量都是strong的。