学习 C++,关键是要理解概念,而不应过于深究语言的技术细节。
学习程序设计语言的目的是为了成为一个更好的程序员,也就是说,是为了能更有效率地设计和实现新系统,以及维护旧系统。
进入C++
C++简介
C++ 是一种静态类型的、编译式的、通用的、大小写敏感的、不规则的编程语言,支持过程化编程、面向对象编程和泛型编程。
注意:使用静态类型的编程语言是在编译时执行类型检查,而不是在运行时执行类型检查。
C++ 完全支持面向对象的程序设计,包括面向对象开发的四大特性:
- 封装
- 抽象
- 继承
- 多态
标准的 C++ 由三个重要部分组成:
- 核心语言,提供了所有构件块,包括变量、数据类型和常量,等等。
- C++ 标准库,提供了大量的函数,用于操作文件、字符串等。
- 标准模板库(STL),提供了大量的方法,用于操作数据结构等。
ANSI 标准是为了确保 C++ 的便携性 —— 您所编写的代码在 Mac、UNIX、Windows、Alpha 计算机上都能通过编译。
由于 ANSI 标准已稳定使用了很长的时间,所有主要的 C++ 编译器的制造商都支持 ANSI 标准。
基本上每个应用程序领域的程序员都有使用 C++。
C++ 通常用于编写设备驱动程序和其他要求实时性地直接操作硬件的软件。
任何一个使用苹果电脑或 Windows PC 机的用户都在间接地使用 C++,因为这些系统的主要用户接口是使用 C++ 编写的。
这里安装 GNU 的 C/C++ 编译器,也即GCC(The GNU Compiler Collection)。
要知道,GCC 官网提供的 GCC 编译器是无法直接安装到 Windows 平台上的,如果我们想在 Windows 平台使用 GCC 编译器,可以安装 GCC 的移植版本。
目前适用于 Windows 平台、受欢迎的 GCC 移植版主要有 2 种,分别为 MinGW 和 Cygwin。其中,MinGW 侧重于服务 Windows 用户可以使用 GCC 编译环境,直接生成可运行 Windows 平台上的可执行程序,相比后者体积更小,使用更方便;而 Cygwin 则可以提供一个完整的 Linux 环境,借助它不仅可以在 Windows 平台上使用 GCC 编译器,理论上可以运行 Linux 平台上所有的程序。
MinGw 全称 Minimalist GNU for Windows,应用于 Windows 平台,可以为我们提供一个功能有限的 Linux 系统环境以使用一些 GNU 工具,比如 GCC 编译器、gawk、bison 等等。
C++ 基本的输入输出
C++ 的 I/O 发生在流中,流是字节序列。如果字节流是从设备(如键盘、磁盘驱动器、网络连接等)流向内存,这叫做输入操作。如果字节流是从内存流向设备(如显示屏、打印机、磁盘驱动器、网络连接等),这叫做输出操作。
下列的头文件在 C++ 编程中很重要:
: 该文件定义了 cin、cout、cerr 和 clog 对象,分别对应于标准输入流、标准输出流、非缓冲标准错误流和缓冲标准错误流。 : 该文件通过所谓的参数化的流操纵器(比如 setw 和 setprecision),来声明对执行标准化 I/O 有用的服务。 : 该文件为用户控制的文件处理声明服务。
标准输出流(cout)
预定义的对象 cout 是 iostream 类的一个实例。cout 对象”连接”到标准输出设备,通常是显示屏。cout 是与流插入运算符 << 结合使用的。
C++ 编译器根据要输出变量的数据类型,选择合适的流插入运算符来显示值。<< 运算符被重载来输出内置类型(整型、浮点型、double 型、字符串和指针)的数据项。
流插入运算符 << 在一个语句中可以多次使用,如cout << "Value of str is : " << str << endl;
,endl 用于在行末添加一个换行符。
标准输入流(cin)
预定义的对象 cin 是 iostream 类的一个实例。cin 对象附属到标准输入设备,通常是键盘。cin 是与流提取运算符 >> 结合使用的。
C++ 编译器根据要输入值的数据类型,选择合适的流提取运算符来提取值,并把它存储在给定的变量中。
流提取运算符 >> 在一个语句中可以多次使用,如果要求输入多个数据,可以使用语句:cin >> name >> age;
标准错误流(cerr)
预定义的对象 cerr 是 iostream 类的一个实例。cerr 对象附属到标准输出设备,通常也是显示屏,但是 cerr 对象是非缓冲的,且每个流插入到 cerr 都会立即输出。
cerr 也是与流插入运算符 << 结合使用的,如:
1 |
|
标准日志流(clog)
预定义的对象 clog 是 iostream 类的一个实例。clog 对象附属到标准输出设备,通常也是显示屏,但是 clog 对象是缓冲的。这意味着每个流插入到 clog 都会先存储在缓冲区,直到缓冲填满或者缓冲区刷新时才会输出。
clog 也是与流插入运算符 << 结合使用的,如下所示:
1 |
|
通过这些小实例,我们无法区分 cout、cerr 和 clog 的差异,但在编写和执行大型程序时,它们之间的差异就变得非常明显。所以良好的编程实践告诉我们,使用 cerr 流来显示错误消息,而其他的日志消息则使用 clog 流来输出。
结构体
为了定义结构,您必须使用 struct 语句。struct 语句定义了一个包含多个成员的新的数据类型,struct 语句的格式如下:
1 | struct type_name { |
type_name 是结构体类型的名称,member_type1 member_name1 是标准的变量定义,在结构定义的末尾,最后一个分号之前,您可以指定一个或多个结构变量(object_names)。
访问结构成员可以使用成员访问运算符(.),如object_names.member_name1
。
对于指向结构的指针,其成员访问方式有变化,可以使用(->)来访问结构体成员。
参考如下:
1 | struct type_name * object_ptr; //现在,您可以在这里定义的指针变量中存储结构变量的地址,为了查找结构变量的地址,请把 & 运算符放在结构变量的前面 |
另外,在函数参数中使用结构体,需要这样定义:void test( struct type_name object_names )
,使用结构体指针也是一样的void test( struct type_name *object_names )
。
使用 typedef 关键字为创建的结构类型取一个”别名”。typedef最后面的是别名,define中间的是别名。例如:
1 | typedef struct Books |
现在,您可以直接使用 alias 来定义 struct Books 类型的变量,而不需要使用 struct 关键字。例如:alias Book1, Book2 ;
还可以使用 typedef 关键字来定义非结构体类型,如下所示:
1 | typedef long int * pint32; |
需要知道的小知识
malloc new
原型:extern void *malloc(unsigned int num_bytes);
头文件:#include <malloc.h
>
功能:分配长度为num_bytes字节的内存块
说明:如果分配成功则返回指向被分配内存的指针,否则返回空指针NULL。
当内存不再使用时,应使用**free()**函数将内存块释放。
说明:malloc 向系统申请分配指定size个字节的内存空间。返回类型是 void 类型。void 表示未确定类型的指针。C,C++规定,void* 类型可以强制转换为任何其它类型的指针。如:p=(char *)malloc(100);
malloc与new的不同点
malloc 和 new 至少有两个不同: new 返回指定类型的指针,并且可以自动计算所需要的字节的数量。比如:int *p = new int; //返回类型为int* 类型(整数型指针),分配大小为 sizeof(int)即四个字节;
还有:int *p = new int [100]; //返回类型为 int* 类型(整数型指针),分配大小为 sizeof(int) * 100;
而 malloc 则必须由我们计算要字节数,并且在返回后强行转换为实际类型的指针。
int *p = (int *) malloc (sizeof(int));
- malloc 函数返回的是 void * 类型,如果你写成:
p = malloc (sizeof(int));
则程序无法通过编译,报错:“不能将 void* 赋值给 int * 类型变量”。所以必须通过 (int *) 来将强制转换。 - 函数的实参为 sizeof(int) ,用于指明一个整型数据需要的大小。如果你写成:
int* p = (int *) malloc (1);
代码也能通过编译,但事实上只分配了1个字节大小的内存空间,当你往里头存入一个整数,就会有3个字节无家可归,而直接“住进邻居家”!造成的结果是后面的内存中原有数据内容全部被清空。
malloc 也可以达到 new [] 的效果,申请出一段连续的内存,方法无非是指定你所需要内存大小。
比如想分配100个int类型的空间:int* p = (int *) malloc ( sizeof(int)*100 );//分配可以放得下100个整数的内存空间。
另外有一点不能直接看出的区别是,malloc 只管分配内存,并不能对所得的内存进行初始化,所以得到的一片新内存中,其值将是随机的。
除了分配及最后释放的方法不一样以外,通过malloc或new得到指针,在其它操作上保持一致。
new 和 delete
给指针初始化指向的数据地址(这一步很重要),常见的有两种方式。一种是,直接将指针指向当前已存在的变量的地址,另一种就是使用new或者C语言中的malloc函数动态分配的地址。
两种初始化方式是有很大区别的,主要区别如下所示:
1 | 初始化指向变量地址的方法是在程序栈中分配变量的内存; |
delete的操作一般是和new动态内存分配成对出现的。delete的作用是将内存释放并归还给内存池,从而高效的使用内存。值得注意的是虽然delete会释放掉指针指向的内存,但是并不会删除指针,因此在删除delete指针后,如果代码后面有需要也可一再次给指针分配地址。delete p;
new/delete和malloc/free之间的区别
相同点:都是用了分配和释放动态内存的
本质上:new/delete是C++中的运算符,而malloc/free只是其C/C++中的某一个库函数
类型安全性:new/delete是安全的,而malloc/free不是安全的:
1 | int* a = new float; //这样在编译时就会报错 |
用法:malloc必须要进行强制类型转换和需要sizeof求出需要的字节数,且对于用户自己定义的对象也不方便用malloc和free来管理,因为不能够执行构造函数和析构函数。而new可以这样用:TreeNode *node = new TreeNode(value);
总结
malloc()函数其实就在内存中找一片指定大小的空间,然后将这个空间的首地址赋值给一个指针变量,这里的指针变量可以是一个单独的指针,也可以是一个数组的首地址,这要看malloc()函数中参数size的具体内容。我们这里malloc分配的内存空间在逻辑上连续的,而在物理上可以连续也可以不连续。对于我们程序员来说,我们关注的是逻辑上的连续,因为操作系统会帮我们安排内存分配,所以我们使用起来就可以当做是连续的。
memset
memset() 函数可以说是初始化内存的“万能函数”,通常为新申请的内存进行初始化工作。它是直接操作内存空间,该函数的原型为:
1 |
|
函数的功能是:将指针变量 s 所指向的前 n 字节的内存单元用一个“整数” c 替换,注意 c 是 int 型。s 是 void 型的指针变量,所以它可以为任何类型的数据进行初始化*。
memset 一般使用“0”初始化内存单元,而且通常是给数组或结构体进行初始化。
memset 函数的第三个参数 n 的值一般用 sizeof() 获取,这样比较专业。
注意,如果是对指针变量所指向的内存单元进行清零初始化,那么一定要先对这个指针变量进行初始化,即一定要先让它指向某个有效的地址。而且用memset给指针变量如p所指向的内存单元进行初始化时,n 千万别写成 sizeof(p),这是新手经常会犯的错误。因为 p 是指针变量,不管 p 指向什么类型的变量,sizeof(p) 的值都是 4。
explicit 关键字
首先, C++中的explicit关键字只能用于修饰只有一个参数的类构造函数, 它的作用是表明该构造函数是显式的, 而非隐式的,。由于无参数的构造函数和多参数的构造函数总是显示调用,这种情况在构造函数前加explicit无意义。
explicit关键字的作用就是防止类构造函数的隐式自动转换。
google的c++规范中提到explicit的优点是可以避免不合时宜的类型变换,缺点无。所以google约定所有单参数的构造函数都必须是显示的,只有极少数情况下拷贝构造函数可以不声明称explicit。例如作为其他类的透明包装器的类。
effective c++中说:被声明为explicit的构造函数通常比其non-explicit兄弟更受欢迎。因为它们禁止编译器执行非预期(往往也不被期望)的类型转换。除非我有一个好理由允许构造函数被用于隐式类型转换,否则我会把它声明为explicit,鼓励大家遵循相同的政策。
define 和 typedef
typedef在前面的结构体小节中提到过了。
vscode插件
学一下
Bookmarks
Doxygen Documentation Generator
Todo Tree
Better Comments
ChatGpt类应用
C++高级教程
cmake
cmake -G "MinGW Makefiles" ..
(这里的 ..
指的是上级目录,后面会说)指明让cmake生成 mingw32-make
使用的 makefile 文件,cmake默认会使用 windows 的 nmake 程序(本机没有所以提示找不到nmake)
mingw32-make 对 makefile 使用 make
命令可以生成可执行程序。
由于所有MinGW教程都会说将mingw64\bin目录下的“mingw32-make.exe”复制一份并改名为 “make.exe”,就可以在终端直接使用 “make”指令而不必使用“mingw32-make”指令,我当时安装的时候以为只需要保留一份副本备份就行,所以保留了一个“mingw32-make-副本.exe”,导致cmake找不到“mingw32-make.exe”,进而前面说的cmake命令一直失败。
使用cmake编译步骤(在源代码文件夹打开终端,这个文件夹中需要包含CMakeLists.txt):
- 编写CMakeLists.txt文件
- 使用命令 这是因为cmake编译会产生一些文件,为避免污染 源文件 所在的文件夹,建立build文件夹来存放编译文件。
1
2
3mkdir build
cd build
cmake -G “MinGW Makefiles” .. - 编译
运行命令make
生成可执行程序
gcc、make、Makefile、CMake 与 CMakeLists
gcc(GNU Compiler Collection)可以看成是GNU编译器套件,可以编译C、C++、Objective-C、Java等多种编程语言。
当程序中只有很少个源文件时,可以直接使用gcc进行编译。但是当程序中包含很多个源文件时,使用gcc命令逐个文件编译的工作量很大且容易出错。
这时候就可以借助make工具进行批量编译和链接。
make本身不具有编译和链接的功能,而是类似于一个智能的批处理工具,通过调用Makefile文件中用户指定的命令进行编译和链接。
Makefile文件中定义了一套调用 gcc 编译源文件的命令。简单工程的Makefile文件可以手动编写,当工程比较大的时候手动编写Makefile文件也很麻烦,并且Makefile中的指令是平台相关的,换个平台还需要再修改。
这时候就可以使用CMake工具自动生成Makefile文件。
CMake工具可以以更加简单的方式自动生成Makefile文件,跨平台时只需要告诉CMake目标平台类型,就可以自动生成目标平台可使用的Makefile文件。
CMake依赖(或根据)CMakeLists.txt文件自动生成Makefile。
CMakeLists.txt需要手动编写。
CMake工具和CMakeLists.txt是一对好基友, make工具和Makefile是另一对好基友。
CMake要解决的问题是项目要在不同平台不同编译器下都可以依据一个统一的脚本(CMakeLists.txt)进行构建的问题。忽略不同平台的差异,抽象成为一个一致的环境。
make要解决的问题是在一个特定的平台环境上依据当前平台的脚本(Makefile),调用gcc(或其他编译器)对源文件进行批量编译链接的问题。
CMake是一个比make更高级的编译配置工具,它可以根据不同平台、不同的编译器,生成相应的Makefile,达到一个编写,多环境下可编译的效果。
所以使用CMake编写一个跨平台的工程的基本流程是:
- 编写代码源文件
- 编写CMakeLists.txt(依据CMake的语法规格和格式)
- 使用CMake工具根据CMakeLists.txt生成Makefile
- 使用make工具根据Makefile,调用gcc编译链接生成可执行目标文件
参考自 windows下 CMake+MinGW 搭建C/C++编译环境 总结的很好
C++ 类 & 对象
C++ 在 C 语言的基础上增加了面向对象编程,C++ 支持面向对象程序设计。类是 C++ 的核心特性,通常被称为用户定义的类型。
类用于指定对象的形式,它包含了数据表示法和用于处理数据的方法。类中的数据和方法称为类的成员。函数在一个类中被称为类的成员。
C++ 类定义
定义一个类,本质上是定义一个数据类型的蓝图。这实际上并没有定义任何数据,但它定义了类的名称意味着什么,也就是说,它定义了类的对象包括了什么,以及可以在这个对象上执行哪些操作。
类定义是以关键字 class 开头,后跟类的名称。类的主体是包含在一对花括号中。类定义后必须跟着一个分号或一个声明列表。例如,我们使用关键字 class 定义 Box 数据类型,如下所示:
1 | class Box |
定义 C++ 对象
类提供了对象的蓝图,所以基本上,对象是根据类来创建的。声明类的对象,就像声明基本类型的变量一样。如:
1 | Box Box1; // 声明 Box1,类型为 Box |
访问数据成员
类的对象的公共(public)数据成员可以使用直接成员访问运算符(.) 来访问。
需要注意的是,私有的成员和受保护的成员不能使用直接成员访问运算符 (.) 来直接访问。
实例如下:
1 |
|
类成员函数
上面例子中的set()和get()都是类成员函数,类的成员函数是指那些把定义和原型写在类定义内部的函数,就像类定义中的其他变量一样。类成员函数是类的一个成员,它可以操作类的任意对象,可以访问对象中的所有成员。
成员函数可以定义在类定义内部,或者单独使用范围解析运算符::来定义。
1 | class Box |
1 | double Box::getVolume(void) |
两种成员函数定义方法等价。需要强调一点,在 :: 运算符之前必须使用类名。调用成员函数是在对象上使用点运算符(.),这样它就能操作与该对象相关的数据。
C++ 类构造函数 & 析构函数
类的构造函数
类的构造函数是类的一种特殊的成员函数,它会在每次创建类的新对象时执行。
构造函数的名称与类的名称是完全相同的,并且不会返回任何类型,也不会返回 void。构造函数可用于为某些成员变量设置初始值。
1 |
|
默认的构造函数没有任何参数,但如果需要,构造函数也可以带有参数。这样在创建对象时就会给对象赋初始值,这样便可以创造出带初始值的对象。
1 |
|
类的析构函数
类的析构函数是类的一种特殊的成员函数,它会在每次删除所创建的对象时执行。
析构函数的名称与类的名称是完全相同的,只是在前面加了个波浪号(~)作为前缀,它不会返回任何值,也不能带有任何参数。析构函数有助于在跳出程序(比如关闭文件、释放内存等)前释放资源。
类访问修饰符
数据封装是面向对象编程的一个重要特点,它防止函数直接访问类类型的内部成员。类成员的访问限制是通过在类主体内部对各个区域标记 public、private、protected 来指定的。关键字 public、private、protected 称为访问修饰符。
一个类可以有多个 public、protected 或 private 标记区域。每个标记区域在下一个标记区域开始之前或者在遇到类主体结束右括号之前都是有效的。成员和类的默认访问修饰符是 private。
1 | class Base { |
公有(public)成员:公有成员在程序中类的外部是可访问的。您可以不使用任何成员函数来设置和获取公有变量的值,如下所示:
1 |
|
私有(private)成员: 私有成员变量或函数在类的外部是不可访问的,甚至是不可查看的。只有类内部和友元函数可以访问私有成员。
默认情况下,类的所有成员都是私有的。例如在下面的类中,width 是一个私有成员,这意味着,如果您没有使用任何访问修饰符,类的成员将被假定为私有成员:
1 | class Box |
实际操作中,我们一般会在私有区域定义数据,在公有区域定义相关的函数,以便在类的外部也可以调用这些函数,如下所示:
1 |
|
protected(受保护)成员:
protected(受保护)成员变量或函数与私有成员十分相似,但有一点不同,protected(受保护)成员在派生类(即子类)中是可访问的。
下面的实例中,我们从父类 Box 派生了一个子类 smallBox。在这里 width 成员可被派生类(即子类)smallBox 的任何成员函数访问。
1 |
|
继承中的特点
有public, protected, private三种继承方式,它们相应地改变了基类(父类)成员的访问属性。
- public 继承:基类 public 成员,protected 成员,private 成员的访问属性在派生类中分别变成:public, protected, private
- protected 继承:基类 public 成员,protected 成员,private 成员的访问属性在派生类中分别变成:protected, protected, private
- private 继承:基类 public 成员,protected 成员,private 成员的访问属性在派生类中分别变成:private, private, private
但无论哪种继承方式,上面两点都没有改变:
- private 成员只能被本类成员(类内)和友元函数访问,不能被派生类访问;
- protected 成员可以被派生类访问。
注意:C中如果函数未指定返回值类型,则默认为int。C++中如果一个函数没有返回值,返回值类型必须指定为void。但要区别于类的构造函数
public继承:
1 |
|
protected继承:
1 |
|
private继承:
1 |
|
注意分辨其中区别,如果是public继承,三种成员在派生类中还是不变的,但是派生类不能访问基类的private成员;如果是protected继承,基类的public和private变为在派生类中都变为protected成员,因此在类中可以访问,但是类外不行,基类的private成员依然不能访问,无论是类中还是类外;如果是private继承,基类的public和protected成员变为派生类中的private成员,类中可以访问,类外不行,且基类的private成员仍然不能在类中或类外访问。
如果继承的时候不显式声明是 private,protected,public 继承,则class 默认是 private 继承,struct默认是public继承。另外,类中不写是什么类型的成员,默认是private。
总结一下三种继承方式:
关于C++中的struct和class
C++ 中的 struct 对 C 中的 struct 进行了扩充,它已经不再只是一个包含不同数据类型的数据结构了,它已经获取了太多的功能。
struct 能包含成员函数吗? 能!
struct 能继承吗? 能!!
struct 能实现多态吗? 能!!!
既然这些它都能实现,那它和 class 还能有什么区别?
最本质的一个区别就是默认的访问控制,体现在两个方面:
1)默认的继承访问权限。struct是public的,class是private的。
你可以写如下的代码:
1 | struct A |
这个时候 B 是 public 继承 A 的。
如果都将上面的 struct 改成 class,那么 B 是 private 继承 A 的。这就是默认的继承访问权限。
所以我们在平时写类继承的时候,通常会这样写:
1 | struct B : public A |
就是为了指明是 public 继承,而不是用默认的 private 继承。
当然,到底默认是 public 继承还是 private 继承,取决于子类而不是基类。
我的意思是,struct 可以继承 class,同样 class 也可以继承 struct,那么默认的继承访问权限是看子类到底是用的 struct 还是 class。如下:
1 | struct A{}; |
2)struct 作为数据结构的实现体,它默认的数据访问控制是 public 的,而 class 作为对象的实现体,它默认的成员变量访问控制是 private 的。
注意我上面的用词,我依旧强调 struct 是一种数据结构的实现体,虽然它是可以像 class 一样的用。我依旧将 struct 里的变量叫数据,class 内的变量叫成员,虽然它们并无区别。
其实,到底是用 struct 还是 class,完全看个人的喜好,你可以将你程序里所有的 class 全部替换成 struct,它依旧可以很正常的运行。但我给出的最好建议,还是:当你觉得你要做的更像是一种数据结构的话,那么用 struct,如果你要做的更像是一种对象的话,那么用 class。
当然,我在这里还要强调一点的就是,对于访问控制,应该在程序里明确的指出,而不是依靠默认,这是一个良好的习惯,也让你的代码更具可读性。
说到这里,很多了解的人或许都认为这个话题可以结束了,因为他们知道 struct 和 class 的“唯一”区别就是访问控制。很多文献上也确实只提到这一个区别。
但我上面却没有用“唯一”,而是说的“最本质”,那是因为,它们确实还有另一个区别,虽然那个区别我们平时可能很少涉及。那就是:“class” 这个关键字还用于定义模板参数,就像 “typename”。但关键字 “struct” 不用于定义模板参数。这一点在 Stanley B.Lippman 写的 Inside the C++ Object Model 有过说明。
问题讨论到这里,基本上应该可以结束了。但有人曾说过,他还发现过其他的“区别”,那么,让我们来看看,这到底是不是又一个区别。还是上面所说的,C++ 中的 struct 是对 C 中的 struct 的扩充,既然是扩充,那么它就要兼容过去 C 中 struct 应有的所有特性。例如你可以这样写:
1 | struct A //定义一个struct |
也就是说 struct 可以在定义的时候用 {} 赋初值。那么问题来了,class 行不行呢?将上面的 struct 改成 class,试试看。报错!噢~于是那人跳出来说,他又找到了一个区别。我们仔细看看,这真的又是一个区别吗?
你试着向上面的 struct 中加入一个构造函数(或虚函数),你会发现什么?
对,struct 也不能用 {} 赋初值了。
的确,以 {} 的方式来赋初值,只是用一个初始化列表来对数据进行按顺序的初始化,如上面如果写成 A a={‘p’,7}; 则 c1,n2 被初始化,而 db3 没有。这样简单的 copy 操作,只能发生在简单的数据结构上,而不应该放在对象上。加入一个构造函数或是一个虚函数会使 struct 更体现出一种对象的特性,而使此{}操作不再有效。
事实上,是因为加入这样的函数,使得类的内部结构发生了变化。而加入一个普通的成员函数呢?你会发现{}依旧可用。其实你可以将普通的函数理解成对数据结构的一种算法,这并不打破它数据结构的特性。
那么,看到这里,我们发现即使是 struct 想用 {} 来赋初值,它也必须满足很多的约束条件,这些条件实际上就是让 struct 更体现出一种数据机构而不是类的特性。
那为什么我们在上面仅仅将 struct 改成 class,{} 就不能用了呢?
其实问题恰巧是我们之前所讲的——访问控制!你看看,我们忘记了什么?对,将 struct 改成 class 的时候,访问控制由 public 变为 private 了,那当然就不能用 {} 来赋初值了。加上一个 public,你会发现,class 也是能用 {} 的,和 struct 毫无区别!!!
做个总结,从上面的区别,我们可以看出,struct 更适合看成是一个数据结构的实现体,class 更适合看成是一个对象的实现体。
继承
面向对象程序设计中最重要的一个概念是继承。继承允许我们依据另一个类来定义一个类,这使得创建和维护一个应用程序变得更容易。这样做,也达到了重用代码功能和提高执行效率的效果。
当创建一个类时,您不需要重新编写新的数据成员和成员函数,只需指定新建的类继承了一个已有的类的成员即可。这个已有的类称为基类,新建的类称为派生类。
访问控制和继承
派生类可以访问基类中所有的非私有成员。因此基类成员如果不想被派生类的成员函数访问,则应在基类中声明为 private。
我们可以根据访问权限总结出不同的访问类型,如下所示:
一个派生类继承了所有的基类方法,但下列情况除外:
- 基类的构造函数、析构函数和拷贝构造函数
- 基类的重载运算符
- 基类的友元函数
继承类型
当一个类派生自基类,该基类可以被继承为 public、protected 或 private 几种类型。继承类型是通过上面讲解的访问修饰符 access-specifier 来指定的。
我们几乎不使用 protected 或 private 继承,通常使用 public 继承。当使用不同类型的继承时,遵循以下几个规则:
- 公有继承(public):当一个类派生自公有基类时,基类的公有成员也是派生类的公有成员,基类的保护成员也是派生类的保护成员,基类的私有成员不能直接被派生类访问,但是可以通过调用基类的公有和保护成员来访问。
- 保护继承(protected): 当一个类派生自保护基类时,基类的公有和保护成员将成为派生类的保护成员。
- 私有继承(private):当一个类派生自私有基类时,基类的公有和保护成员将成为派生类的私有成员。
多继承
多继承即一个子类可以有多个父类,它继承了多个父类的特性。
C++ 类可以从多个类继承成员,语法如下:
1 | class <派生类名>:<继承方式1><基类名1>,<继承方式2><基类名2>,… |
C++ 重载运算符和重载函数
C++ 允许在同一作用域中的某个函数和运算符指定多个定义,分别称为函数重载和运算符重载。
重载声明是指一个与之前已经在该作用域内声明过的函数或方法具有相同名称的声明,但是它们的参数列表和定义(实现)不相同。
当您调用一个重载函数或重载运算符时,编译器通过把您所使用的参数类型与定义中的参数类型进行比较,决定选用最合适的定义。选择最合适的重载函数或重载运算符的过程,称为重载决策。
重载函数:
在同一个作用域内,可以声明几个功能类似的同名函数,但是这些同名函数的形式参数(指参数的个数、类型或者顺序)必须不同。您不能仅通过返回类型的不同来重载函数。
下面的实例中,同名函数 print() 被用于输出不同的数据类型:
1 |
|
C++ 中的运算符重载
您可以重定义或重载大部分 C++ 内置的运算符。这样,您就能使用自定义类型的运算符。
重载的运算符是带有特殊名称的函数,函数名是由关键字 operator 和其后要重载的运算符符号构成的。与其他函数一样,重载运算符有一个返回类型和一个参数列表。
Box operator+(const Box&);
声明加法运算符用于把两个 Box 对象相加,返回最终的 Box 对象。大多数的重载运算符可被定义为普通的非成员函数或者被定义为类成员函数。如果我们定义上面的函数为类的非成员函数,那么我们需要为每次操作传递两个参数,如下所示:
Box operator+(const Box&, const Box&);
C++引用
&
引用是 C++ 的新增内容,在实际开发中会经常使用;C++ 用的引用就如同C语言的指针一样重要,但它比指针更加方便和易用,有时候甚至是不可或缺的。
同指针一样,引用能够减少数据的拷贝,提高数据的传递效率。
多态与虚函数
面向对象程序设计语言有封装、继承和多态三种机制,这三种机制能够有效提高程序的可读性、可扩充性和可重用性。
“多态(polymorphism)”指的是同一名字的事物可以完成不同的功能。多态可以分为编译时的多态和运行时的多态。前者主要是指函数的重载(包括运算符的重载)、对重载函数的调用,在编译时就能根据实参确定应该调用哪个函数,因此叫编译时的多态;而后者则和继承、虚函数等概念有关,是本章要讲述的内容。本教程后面提及的多态都是指运行时的多态。
模板和泛型程序设计
泛型程序设计(generic programming)是一种算法在实现时不指定具体要操作的数据的类型的程序设计方法。所谓“泛型”,指的是算法只要实现一遍,就能适用于多种数据类型。泛型程序设计方法的优势在于能够减少重复代码的编写。
泛型程序设计的概念最早出现于 1983 年的 Ada 语言,其最成功的应用就是 C++ 的标准模板库(STL)。也可以说,泛型程序设计就是大量编写模板、使用模板的程序设计。泛型程序设计在 C++ 中的重要性和带来的好处不亚于面向对象的特性。
在 C++ 中,模板分为函数模板和类模板两种。熟练的 C++ 程序员,在编写函数时都会考虑能否将其写成函数模板,编写类时都会考虑能否将其写成类模板,以便实现重用。
函数模板
我们知道,数据的值可以通过函数参数传递,在函数定义时数据的值是未知的,只有等到函数调用时接收了实参才能确定其值。这就是值的参数化。
在C++中,数据的类型也可以通过参数来传递,在函数定义时可以不指明具体的数据类型,当发生函数调用时,编译器可以根据传入的实参自动推断数据类型。这就是类型的参数化。
值(Value)和类型(Type)是数据的两个主要特征,它们在C++中都可以被参数化。
所谓函数模板,实际上是建立一个通用函数,它所用到的数据的类型(包括返回值类型、形参类型、局部变量类型)可以不具体指定,而是用一个虚拟的类型来代替(实际上是用一个标识符来占位),等发生函数调用时再根据传入的实参来逆推出真正的类型。这个通用函数就称为函数模板(Function Template)。
在函数模板中,数据的值和类型都被参数化了,发生函数调用时编译器会根据传入的实参来推演形参的值和类型。换个角度说,函数模板除了支持值的参数化,还支持类型的参数化。
一旦定义了函数模板,就可以将类型参数用于函数定义和函数声明了。说得直白一点,原来使用 int、float、char 等内置类型的地方,都可以用类型参数来代替。
1 |
|
template是定义函数模板的关键字,它后面紧跟尖括号<>,尖括号包围的是类型参数(也可以说是虚拟的类型,或者说是类型占位符)。typename是另外一个关键字,用来声明具体的类型参数,这里的类型参数就是T,实际上可以随意指定。从整体上看,template
模板头中包含的类型参数可以用在函数定义的各个位置,包括返回值、形参列表和函数体;本例我们在形参列表和函数体中使用了类型参数T。
类型参数的命名规则跟其他标识符的命名规则一样,不过使用 T、T1、T2、Type 等已经成为了一种惯例。
1 |
|
下面我们来总结一下定义模板函数的语法:
template <typename 类型参数1 , typename 类型参数2 , …> 返回值类型 函数名(形参列表){
//在函数体中可以使用类型参数
}
类型参数可以有多个,它们之间以逗号,分隔。类型参数列表以< >包围,形式参数列表以( )包围。
typename关键字也可以使用class关键字替代,它们没有任何区别。
STL
STL 容器
简单的理解容器,它就是一些模板类的集合,但和普通模板类不同的是,容器中封装的是组织数据的方法(也就是数据结构)。STL 提供有 2 类标准容器,分别是序列容器、排序容器和哈希容器,其中后两类容器有时也统称为关联容器。
C++ 11 标准中不同容器指定使用的迭代器类型。
STL 序列容器
STL标准库中所有的序列式容器,包括 array、vector、deque、list 和 forward_list容器。
所谓STL序列式容器,其共同的特点是不会对存储的元素进行排序,元素排列的顺序取决于存储它们的顺序。
vector
vector<T> 容器是包含 T 类型元素的序列容器,和 array<T,N> 容器相似,不同的是 vector<T> 容器的大小可以自动增长,从而可以包含任意数量的元素;因此类型参数 T 不再需要模板参数 N。只要元素个数超出 vector 当前容量,就会自动分配更多的空间。只能在容器尾部高效地删除或添加元素。
vector<T> 容器可以方便、灵活地代替数组。在大多数时候,都可以用 vector<T> 代替数组存放元素。只要能够意识到,vector<T> 在扩展容量,以及在序列内部删除或添加元素时会产生一些开销;但大多数情况下,代码不会明显变慢。 为了使用 vector<T> 容器模板,需要在代码中包含头文件 vector。
vector 容器的成员函数,用成员符号 . 调用
1 | begin() 返回指向容器中第一个元素的迭代器。 |
1 | //初始化 |
vector可以用 ListNode 或 ListNode* 数据类型,栈也可以
for (int u: A) 和 for(auto &u:A) 的区别:
这里(int u: A) 的int是怎么定的呢, 要看A中的元素的数据类型,比如A是vector<int>,那A中的元素肯定是int型的,u遍历A,那就是int u了。
再比如A为string对象,那u肯定是char型,所以(char u : A)、(char &u : A)、(auto u : A)、(auto &u : A)都是可以的。用(string u : A)就不行。
在c11标准下可以执行的特殊格式的for循环语句,区别在于引用类型可以改变原来的值
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16 >int main()
>{
string s("hello world");
for(auto c:s)
c='t';
cout<<s<<endl;//结果为hello world
for(auto &c:s)
c='t';
cout<<s<<endl; //结果为ttttttttttt
>}
C++ 的 auto 关键字的使用目的是: 允许编译器推断出变量的类型,例如,像下面这样写code是可行的:
1 | vector <int> v; |
因为编译器知道 v.begin() 必须返回 vector<int>::iterator 于是就可以创建这种类型的变量, 从而可以省掉 typedef 或少敲键盘。
STL 关联式容器
关联式容器,包括 map、multimap、set 以及 multiset 这 4 种容器。
和序列式容器不同的是,关联式容器在存储元素时还会为每个元素再配备一个键,整体以键值对的方式存储到容器中。相比前者,关联式容器可以通过键值直接找到对应的元素,而无需遍历整个容器。另外,关联式容器在存储元素时,默认会根据各元素键的大小做升序排序。
无论是哪种序列式容器,其存储的都是 C++ 基本数据类型(诸如 int、double、float、string 等)或使用结构体自定义类型的元素,
关联式容器则大不一样,此类容器在存储元素值的同时,还会为各元素额外再配备一个值(又称为“键”,其本质也是一个 C++ 基础数据类型或自定义类型的元素),它的功能是在使用关联式容器的过程中,如果已知目标元素的键的值,则直接通过该键就可以找到目标元素,而无需再通过遍历整个容器的方式。
也就是说,使用关联式容器存储的元素,都是一个一个的“键值对”( <key,value> ),这是和序列式容器最大的不同。
除此之外,序列式容器中存储的元素默认都是未经过排序的,而使用关联式容器存储的元素,默认会根据各元素的键值的大小做升序排序。
关联式容器所具备的这些特性,归咎于 STL 标准库在实现该类型容器时,底层选用了红黑树这种数据结构来组织和存储各个键值对。
C++ STL 标准库提供了 4 种关联式容器,分别为 map、set、multimap、multiset:
除此之外,C++ 11 还新增了 4 种哈希容器,即 unordered_map、unordered_multimap 以及 unordered_set、unordered_multiset。严格来说,它们也属于关联式容器,但哈希容器底层采用的是哈希表,而不是红黑树。
注意: 基于各个关联式容器存储数据的特点,只有各个键值对中的键和值全部对应相等时,才能使用 set 和 multiset 关联式容器存储,否则就要选用 map 或者 multimap 关联式容器。
STL 无序关联式容器
无序关联式容器,又称哈希容器。和关联式容器一样,此类容器存储的也是键值对元素;不同之处在于,关联式容器默认情况下会对存储的元素做升序排序,而无序关联式容器不会。
和其它类容器相比,无序关联式容器擅长通过指定键查找对应的值,而遍历容器中存储元素的效率不如关联式容器。
无序容器是 C++ 11 标准才正式引入到 STL 标准库中的,这意味着如果要使用该类容器,则必须选择支持 C++ 11 标准的编译器。
和关联式容器一样,无序容器也使用键值对(pair 类型)的方式存储数据。不过二者有本质上的不同:
- 关联式容器的底层实现采用的树存储结构,更确切的说是红黑树结构;
- 无序容器的底层实现采用的是哈希表的存储结构。
基于底层实现采用了不同的数据结构,因此和关联式容器相比,无序容器具有以下 2 个特点:
- 无序容器内部存储的键值对是无序的,各键值对的存储位置取决于该键值对中的键;
- 和关联式容器相比,无序容器擅长通过指定键查找对应的值(平均时间复杂度为 O(1));但对于使用迭代器遍历容器中存储的元素,无序容器的执行效率则不如关联式容器。
和关联式容器一样,无序容器只是一类容器的统称,其包含有 4 个具体容器,分别为 unordered_map、unordered_multimap、unordered_set 、unordered_multiset。
可以看出:C++ 11 标准的 STL 中,在已提供有 4 种关联式容器的基础上,又新增了各自的“unordered”版本(无序版本、哈希版本),提高了查找指定元素的效率。
总的来说,实际场景中如果涉及大量遍历容器的操作,建议首选关联式容器;反之,如果更多的操作是通过键获取对应的值,则应首选无序容器。
unordered_map
unordered_map 容器在
nordered_map 容器模板的定义如下所示:
1 | template < class Key, //键值对中键的类型 |
模板类参数:
默认哈希函数是对键(key)使用的,而且只适用于基本数据类型(包括string),而不支持自定义的结构体或类。
总的来说,当无序容器中存储键值对的键为自定义类型时,默认的哈希函数 hash 以及比较函数 equal_to 将不再适用,只能自己设计适用该类型的哈希函数和比较函数,并显式传递给 Hash 参数和 Pred 参数。
初始化:std::unordered_map< Tkey, Tvalue > umap;
1 | begin() 返回指向容器中第一个键值对的正向迭代器。 |
需要注意的是,如果当前容器中并没有存储以 [ ] 运算符内指定的元素作为键的键值对,则此时 [ ] 运算符的功能将转变为:向当前容器中添加以目标元素为键的键值对。举个例子:
1 |
|
可以看到,当使用 [ ] 运算符向 unordered_map 容器中添加键值对时,分为 2 种情况:
- 当 [ ] 运算符位于赋值号(=)右侧时,则新添加键值对的键为 [ ] 运算符内的元素,其值为键值对要求的值类型的默认值(string 类型默认值为空字符串);
- 当 [ ] 运算符位于赋值号(=)左侧时,则新添加键值对的键为 [ ] 运算符内的元素,其值为赋值号右侧的元素。
unordered_map修改键值对的值value直接像数组那样操作就可以了,也可以用迭代器。
unordered_set
unordered_set 容器具有以下几个特性:
- 不再以键值对的形式存储数据,而是直接存储数据的值;
- 容器内部存储的各个元素值都互不相等,且不能被修改;
- 不会对内部存储的数据进行排序;
实现 unordered_set 容器的模板类定义在
unordered_set 容器的类模板定义如下:
1 | template < class Key, //容器中存储元素的类型 |
注意,如果 unordered_set 容器中存储的元素为自定义的数据类型,则默认的哈希函数 hash
初始化:std::unordered_set< T > uset;
1 | begin() 返回指向容器中第一个元素的正向迭代器。 |
注意,此容器模板类中没有重载 [ ] 运算符,也没有提供 at() 成员方法。不仅如此,由于 unordered_set 容器内部存储的元素值不能被修改,因此无论使用哪个迭代器方法获得的迭代器,都不能用于修改容器中元素的值。
1 | //遍历输出 uset 容器存储的所有元素 |
STL 容器适配器
这里是 SGI STL 版本 !
容器适配器是一个封装了序列容器的类模板,它在一般序列容器的基础上提供了一些不同的功能。之所以称作适配器类,是因为它可以通过适配容器现有的接口来提供不同的功能。
主要介绍 2种容器适配器,分别是 stack、queue:
- stack
:是一个封装了 deque 容器 的适配器类模板,默认实现的是一个后入先出(Last-In-First-Out,LIFO)的压入栈。stack模板定义在头文件 stack 中。 - queue
:是一个封装了 deque 容器 的适配器类模板,默认实现的是一个先入先出(First-In-First-Out,LIFO)的队列。可以为它指定一个符合确定条件的基础容器。queue模板定义在头文件 queue 中。 - priority_queue
:是一个封装了 vector 容器 的适配器类模板,默认实现的是一个会对元素排序,从而保证最大元素总在队列最前面的队列。priority_queue模板定义在头文件 queue 中。
适配器类在基础序列容器的基础上实现了一些自己的操作,显然也可以添加一些自己的操作。它们提供的优势是简化了公共接口,而且提高了代码的可读性。
其实,容器适配器中的“适配器”,和生活中常见的电源适配器中“适配器”的含义非常接近。我们知道,无论是电脑、手机还是其它电器,充电时都无法直接使用 220V 的交流电,为了方便用户使用,各个电器厂商都会提供一个适用于自己产品的电源线,它可以将 220V 的交流电转换成适合电器使用的低压直流电。
从用户的角度看,电源线扮演的角色就是将原本不适用的交流电变得适用,因此其又被称为电源适配器。
容器适配器也是同样的道理,简单的理解容器适配器,其就是将不适用的序列式容器(包括 vector、deque 和 list)变得适用。容器适配器的底层实现是通过封装某个序列式容器,并重新组合该容器中包含的成员函数,使其满足某些特定场景的需要。
容器适配器本质上还是容器,只不过此容器模板类的实现,利用了大量其它基础容器模板类中已经写好的成员函数。当然,如果必要的话,容器适配器中也可以自创新的成员函数。
需要注意的是,STL 中的容器适配器,其内部使用的基础容器并不是固定的,用户可以在满足特定条件的多个基础容器中自由选择。
STL 提供了 3 种容器适配器,分别为 stack 栈适配器、queue 队列适配器以及 priority_queue 优先权队列适配器。其中,各适配器所使用的默认基础容器以及可供用户选择的基础容器,如下表 所示:
不同场景下,由于不同的序列式容器其底层采用的数据结构不同,因此容器适配器的执行效率也不尽相同。但通常情况下,使用默认的基础容器即可。
C++ STL stack
stack 栈适配器是一种单端开口的容器,实际上该容器模拟的就是栈存储结构,即无论是向里存数据还是从中取数据,都只能从这一个开口实现操作。
stack 适配器的开口端通常称为栈顶。由于数据的存和取只能从栈顶处进行操作,因此对于存取数据,stack 适配器有这样的特性,即每次只能访问适配器中位于最顶端的元素,也只有移除 stack 顶部的元素之后,才能访问位于栈中的元素。
栈中存储的元素满足“后进先出(简称LIFO)”的准则,stack 适配器也同样遵循这一准则。
stack容器适配器的创建
stack 适配器以模板类 stack<T,Container=deque
创建 stack 适配器,大致分为如下几种方式:
- 创建一个不包含任何元素的 stack 适配器,并采用默认的 deque 基础容器:
std::stack<int> values;
上面这行代码,就成功创建了一个可存储 int 类型元素,底层采用 deque 基础容器的 stack 适配器。 - stack<T,Container=deque
> 模板类提供了 2 个参数,通过指定第二个模板类型参数,我们可以使用除 deque 容器外的其它序列式容器,只要该容器支持 empty()、size()、back()、push_back()、pop_back() 这 5 个成员函数即可。
序列式容器中同时包含这 5 个成员函数的,有 vector、deque 和 list 这 3 个容器。因此,stack 适配器的基础容器可以是它们 3 个中任何一个。例如,下面展示了如何定义一个使用 list 基础容器的 stack 适配器:std::stack<int, std::list<int>> values;
- 可以用一个基础容器来初始化 stack 适配器,只要该容器的类型和 stack 底层使用的基础容器类型相同即可。例如:
std::list<int> values {1, 2, 3};
std::stack<int,std::list<int>> my_stack (values);
注意,初始化后的 my_stack 适配器中,栈顶元素为 3,而不是 1。另外在第 2 行代码中,stack 第 2 个模板参数必须显式指定为 list<int>(必须为 int 类型,和存储类型保持一致),否则 stack 底层将默认使用 deque 容器,也就无法用 lsit 容器的内容来初始化 stack 适配器。 - 还可以用一个 stack 适配器来初始化另一个 stack 适配器,只要它们存储的元素类型以及底层采用的基础容器类型相同即可。例如:注意:第 3、4 种初始化方法中,my_stack 适配器的数据是经过拷贝得来的,也就是说,操作 my_stack 适配器,并不会对 values 容器以及 my_stack1 适配器有任何影响;反过来也是如此。
1
2
3
4std::list<int> values{ 1, 2, 3 };
std::stack<int, std::list<int>> my_stack1(values);
std::stack<int, std::list<int>> my_stack=my_stack1;
//std::stack<int, std::list<int>> my_stack(my_stack1);
stack容器适配器支持的成员函数
和其他序列容器相比,stack 是一类存储机制简单、提供成员函数较少的容器。
1 | empty() 当 stack 栈中没有元素时,该成员函数返回 true;反之,返回 false。 |
1 | int main() |
C++ STL queue
和 stack 栈容器适配器不同,queue 容器适配器有 2 个开口,其中一个开口专门用来输入数据,另一个专门用来输出数据,如下:
这种存储结构最大的特点是,最先进入 queue 的元素,也可以最先从 queue 中出来,即用此容器适配器存储数据具有“先进先出(简称 “FIFO” )”的特点,因此 queue 又称为队列适配器。
STL queue 容器适配器模拟的就是队列这种存储结构,因此对于任何需要用队列进行处理的序列来说,使用 queue 容器适配器都是好的选择。
queue容器适配器的创建
queue 容器适配器以模板类 queue<T,Container=deque
queue容器的创建与stack非常类似。
- 创建一个空的 queue 容器适配器,其底层使用的基础容器选择默认的 deque 容器:
std::queue<int> values;
- 也可以手动指定 queue 容器适配器底层采用的基础容器类型,queue 容器适配器底层容器可以选择 deque 和 list。
下面创建了一个使用 list 容器作为基础容器的空 queue 容器适配器:std::queue<int, std::list<int>> values;
在手动指定基础容器的类型时,其存储的数据类型必须和 queue 容器适配器存储的元素类型保持一致。 - 可以用基础容器来初始化 queue 容器适配器,只要该容器类型和 queue 底层使用的基础容器类型相同即可。例如:
std::deque<int> values{1,2,3};
std::queue<int> my_queue(values);
由于 my_queue 底层采用的是 deque 容器,和 values 类型一致,且存储的也都是 int 类型元素,因此可以用 values 对 my_queue 进行初始化。 - 直接通过 queue 容器适配器来初始化另一个 queue 容器适配器,只要它们存储的元素类型以及底层采用的基础容器类型相同即可。例如:
1
2
3
4
5std::deque<int> values{1,2,3};
std::queue<int> my_queue1(values);
std::queue<int> my_queue(my_queue1);
//或者使用
//std::queue<int> my_queue = my_queue1;
queue容器适配器支持的成员函数
和 stack 一样,queue 也没有迭代器,因此访问元素的唯一方式是遍历容器,通过不断移除访问过的元素,去访问下一个元素。
1 | empty() 如果 queue 中没有元素的话,返回 true。 |
1 | int main() |