原理:C++为什么一般把模板实现放入头文件

虚幻大学 xuhss 161℃ 0评论

? 优质资源分享 ?

学习路线指引(点击解锁) 知识定位 人群定位
? Python实战微信订餐小程序 ? 进阶级 本课程是python flask+微信小程序的完美结合,从项目搭建到腾讯云部署上线,打造一个全栈订餐系统。
?Python量化交易实战? 入门级 手把手带你打造一个易扩展、更安全、效率更高的量化交易系统

写在前面

本文通过实例分析与讲解,解释了为什么C++一般将模板实现放在头文件中。这主要与C/C++的编译机制以及C++模板的实现原理相关,详情见正文。同时,本文给出了不将模板实现放在头文件中的解决方案。

正文

例子

现有如下3个文件:

fc1cf4b5edb0f34646f6c48cac03b1d7 - 原理:C++为什么一般把模板实现放入头文件29c53f715bc8c8d5ee8543ef507a6755 - 原理:C++为什么一般把模板实现放入头文件

 1 // add.h
 2 template 
 3 T Add(const T &a, const T &b);
 4 
 5 // add.cpp
 6 #include "add.h"
 7 
 8 template 
 9 T Add(const T &a, const T &b)
10 {
11 return a + b;
12 }
13 
14 // main.cpp
15 #include "add.h"
16 #include 
17 
18 int main()
19 {
20 int res = Add<int>(1, 2);
21 std::cout << res << "\n";
22 return 0;
23 }

示例代码
现象

使用 g++ -c add.cpp 编译生成 add.o ,使用 g++ -c main.cpp 编译生成 main.o ,这两步都没有问题。

使用 g++ -o main.exe main.o add.o 生成 main.exe 时,报错 undefined reference to 'int Add(int const&, int const&)' 。

当然,直接 g++ add.cpp main.cpp -o main.exe 肯定也会报错,这里把编译和链接分开是为了更好地展示与分析问题。​

原因

出现上述问题的原因是:

(1)C/C++源文件是按编译单元(translation unit)分开、独立编译的。所谓translation unit,其实就是输入给编译器的source code,只不过该source code是经过预处理(pre-processed​,包括去掉注释、宏替换、头文件展开)的。在本例中,即便你使用 g++ add.cpp main.cpp -o main.exe ,编译器也是分别编译 add.cpp 和 main.cpp (注意是预处理后的)的。在编译 add.cpp 时,编译器根本感知不到 main.cpp 的存在,反之同理。

(2) C++模板是通过实例化(instantiation)来实现多态(polymorphism)的。以函数模板为例,首先需要区分“函数模板”和“模板函数”。本例中,上面代码的第8~12行是函数模板,顾名思义,它就是一个模子,不是具体的函数,是不能运行的;当用具体的类型,如 int ,实例化模板参数 T 后,会生成函数模板的一个具体实例,称为模板函数,这是真正可以运行的函数。“函数模板”和“模板函数”的关系,可以类比“类”和“对象”的关系。以 int 为例,生成的实例/模板函数大概长这样(细节上肯定和编译器的实际实现有出入,但核心意思不会变)。

ea45fd47341c2d9cdbc19d49e97d4c1a - 原理:C++为什么一般把模板实现放入头文件bd2f3608ad1bc257806cc4a0bf4eaadd - 原理:C++为什么一般把模板实现放入头文件

1 int Add\_int\_int(const int &a, const int &b)
2 {
3     return a + b;
4 }

模板函数(示例)
​对于每一个用到的具体类型,编译器都会生成对应版本的实例,当函数调用时,会调用到该实例。如用到了 Add ,就会生成 Add_int_int ,用到了 Add ,就会生成 Add_double_double ,等等。本例中,当编译器编译到第20行,即 int res = Add(1, 2); 一句时,编译器就会试图生成 int 版本的模板实例(即模板函数)。

(3)编译器为模板生成实例的必要条件是:1. 知道模板的具体定义/实现;2. 知道模板参数对应的实际类型。

分析

下面把上面两节内容结合起来分析。

(1)当编译 add.cpp 时,相当于编译

cadf60f9497b1b53845dc17c940d7d70 - 原理:C++为什么一般把模板实现放入头文件a53900705017f801051643838f66ff53 - 原理:C++为什么一般把模板实现放入头文件

1 template 
2 T Add(const T &a, const T &b);
3 
4 template 
5 T Add(const T &a, const T &b)
6 {
7 return a + b;
8 }

预处理后的add.cpp
此时编译器虽然知道模板的具体定义,却不知道模板参数 T 的具体类型,因此不会生成任何的实例化代码。

(2)当编译 main.cpp 时,相当于编译

3874e5226c3514c67521cd97c1453313 - 原理:C++为什么一般把模板实现放入头文件3447426dc41b631f6db4d0ab24af7cef - 原理:C++为什么一般把模板实现放入头文件

 1 #include 
 2 
 3 template 
 4 T Add(const T &a, const T &b);
 5 
 6 int main()
 7 {
 8 int res = Add<int>(1, 2);
 9 std::cout << res << "\n";
10 return 0;
11 }

预处理后的main.cpp
当编译到 int res = Add(1, 2); 时,编译器想要生成 int 版本的函数实例,但它找不到函数模板的具体定义(即 Add 的“函数体”),只好作罢。好在编译器看到了函数模板的声明,于是通过了编译,将寻找 int 版本函数实例的任务留给了链接器。​

至此,编译 add.cpp 时,只知模板定义,不知模板类型参数,无法生成具体的函数定义;编译 main.cpp 时,只知模板类型参数,不知模板定义,同样无法生成具体的函数定义。​

(3)没什么好说的,链接器在 add.o 和 main.o 中都没找到 int 版本的 Add 定义,直接报错。​

解决方案

方案一

传统方法:把模板实现也放在头文件中。

793ac81eeac97cb0fb66b2b5b075763e - 原理:C++为什么一般把模板实现放入头文件5dbe4350200d05ab3492228f1081c80d - 原理:C++为什么一般把模板实现放入头文件

 1 // add.h
 2 template 
 3 T Add(const T &a, const T &b)
 4 {
 5 return a + b;
 6 }
 7 
 8 // main.cpp
 9 #include "add.h"
10 #include 
11 
12 int main()
13 {
14 int res = Add<int>(1, 2);
15 std::cout << res << "\n";
16 return 0;
17 }

解决方案一
当编译 main.cpp 时,相当于编译​

d1e70dba45febcb437441f14305e014b - 原理:C++为什么一般把模板实现放入头文件048b9e37f91bfe81ace984c70fa4557e - 原理:C++为什么一般把模板实现放入头文件

 1 #include 
 2 
 3 template 
 4 T Add(const T &a, const T &b)
 5 {
 6 return a + b;
 7 }
 8 
 9 int main()
10 {
11 int res = Add<int>(1, 2);
12 std::cout << res << "\n";
13 return 0;
14 }

预处理后的main.cpp
此时编译器既知道函数模板的定义,又知道具体的模板类型参数 int ,因此可以生成 int 版本的函数实例,不会出错。​

这种方式的优缺点如下:

  • 优点:可以按需生成。假如我们在 main.cpp 中调用了 Add(1.0, 2.0); ,编译器就会为我们生成 double 版本的函数实例。
  • 缺点:不得不把实现细节暴露给用户。

方案二

模板声明和定义分离的方案。​

46018400ed4804bb4f14b88133a917ee - 原理:C++为什么一般把模板实现放入头文件8fd6967dacb44396afef492ad1cf0002 - 原理:C++为什么一般把模板实现放入头文件

 1 // add.h
 2 template 
 3 T Add(const T &a, const T &b);
 4 
 5 // add.cpp
 6 #include "add.h"
 7 
 8 template 
 9 T Add(const T &a, const T &b)
10 {
11 return a + b;
12 }
13 
14 template int Add(const int &a, const int &b);
15 
16 // main.cpp
17 #include "add.h"
18 #include 
19 
20 int main()
21 {
22 int res = Add<int>(1, 2);
23 std::cout << res << "\n";
24 return 0;
25 }

解决方案二
注意, template int Add(const int &a, const int &b); 是函数模板实例化(function template instantiation)[1], template 关键字不能省略,否则, int Add(const int &a, const int &b); 会被编译器当做普通函数的声明,从而在链接时又会报 undefined reference to 'int Add(int const&, int const&)' 错误。​

对于这种写法,编译器在编译 add.cpp 时,既能看到函数模板的定义,又能看到具体的模板类型参数 int ,于是生成了 int 版本的函数实例,整个程序可以正常编译运行。​

很显然,这种情况下编译器只生成了 int 版本的函数实例,所以,在 main.cpp 中使用 Add(1.0, 2.0); 这样的代码肯定是不可以的。这种情况的优缺点可以辩证看待:​

  • 优点:1. 可以隐藏实现细节(我们可以把 add.cpp 做成.lib或.dll);2. 也可以限制只实例化特定的版本。​
  • 缺点:就是只能使用特定的几个版本,不能像方案一那样在编译 main.cpp 时根据具体的调用情况按需生成。​

从这里也可以看出,模板实现不一定非得放在头文件中

参考

[1] Function template - cppreference.com[2] c++ - Why can templates only be implemented in the header file? - Stack Overflow

写在后面

本文从C/C++编译机制以及C++模板实现原理的角度,结合具体实例,讲解了为什么一般将模板实现放在头文件中。由于在下才疏学浅,能力有限,错误疏漏之处在所难免,恳请广大读者批评指正,您的批评是在下前进的不竭动力。

转载请注明:xuhss » 原理:C++为什么一般把模板实现放入头文件

喜欢 (0)

您必须 登录 才能发表评论!