Android NDK入门：C++ 基础知识

2020 年 4 月 1 日
笔记

为什么写这篇文章

本文算作是《Android 音视频开发打怪升级》系列文章的“番外”篇，原本打算将本文的内容写在《Android FFmpeg视频解码播放》这篇文章中，因为要想学习 FFmpeg 相关知识，C++ 的基础知识是必不可少的。

但是写着写着发现，篇幅还是太长了，加上有部分小伙伴对 C++ 可能也比较熟悉，所以把此节独立成篇，更有利于不熟悉 C++ 的小伙伴学习查看，熟悉的小伙伴也可以直接跳过。

C++ 相对于 Java 还是有许多的不同之处，对于没有使用过 C++ 的人来说，如果要学习 NDK 开发，C++ 是第一道坎，必须要掌握。

本文通过对比的方式，把 C++ 和 Java 之间最基础，也是最常使用知识的异同标记出来，方便大家学习。

当然了，本文只是重点对 C++ 中最常用的，也是重点的知识进行讲解，如有时间，最好还是系统地学一下相关的基础知识。

本文你可以了解到

本文使用对比的方式，将 C++ 与我们非常熟悉的 Java 进行对比学习，介绍 C++ 与 Java 使用的异同，帮助大家快速入门 C++ 。

一、 C++ 基本数据类型

C++ 提供了一下几种基础数据类型

类型	关键字
布尔型	bool
字符型	char
整型	int
浮点型	float
双浮点型	double
无类型	void

同时，这些类型还可以被类型修饰符修饰，拓展出更多的数据类型：

类型修饰符	关键字
有符号类型	signed
无符号类型	unsigned
短类型	short
长类型	long

其中 signed 和 unsigned 指定了数据是否有正负； short 和 long 主要指定了数据的内存大小。

由于不同的系统，同个数据类型所占用的内存大小也不一定是一样的，以下是典型值：

类型	内存大小	范围
char	1 个字节	-128到127 或 0到255
unsigned char	1 个字节	0 到 255
signed char	1 个字节	-128 到 127
int	4 个字节	-2147483648 到 2147483647
unsigned int	4 个字节	0 到 4294967295
signed int	4 个字节	-2147483648 到 2147483647
short int	2 个字节	-32768 到 32767
unsigned short int	2 个字节	0 到 65,535
signed short int	2 个字节	-32768 到 32767
long int	8 个字节	-xxx 到 xxx
signed long int	8 个字节	-xxx 到 xxx
unsigned long int	8 个字节	-xxx 到 xxx
float	4 个字节	-xxx 到 xxx
double	8 个字节	-xxx 到 xxx
long double	16 个字节	-xxx 到 xxx

可以看到，

short 修饰符将原类型内存大小减小一半；

long 修饰符将原数据类型内存大小扩大一倍。

二、C++ 类

C++ 是一门面向对象的语言，类是必不可少的。其类的定义与 Java 大同小异。

Java 类通常声明和定义通常都是在同一个文件 xxx.java 中。

而 C++ 类的声明和定义通常是分开在两个不同的文件中，分别是 .h 头文件 和 .cpp 文件

定义一个类

一个 类的头文件 通常如下：

// A.h    class A  {  private: //私有属性      int a;      void f1();    protected: //子类可见      int b;      void f2(int i);    public: //公开属性      int c = 2;      int f3(int j);        A(int a, int b); // 构造函数      ～A(); //析构函数    };

对应的类实现文件 A.cpp如下：

// A.cpp    /**   * 实现构造函数   */  A::A(int a, int b):  a(a),  b(b) {    }    // 等价于    /*  A::A(int a, int b) {      this.a = a;      this.b = b;  }  */    /**   * 实现析构函数   */  A::~A() {    }    /**   * 实现 f1 方法   */  void A::f1() {      }    /**   * 实现 f2 方法   */  void A::f2(int j) {      this.b = j  }    /**   * 实现 f3 方法   */  int A::f3(int j) {      this.c = j  }

可以看到，.h 文件主要负责类成员变量和方法的声明； .cpp 文件主要负责成员变量和方法的定义。

但是，并非一定要按照这样的结构去实现类，你也可以在 .h 头文件中直接定义变量和方法。

比如：

// A.h    class A {  private:      int a = 1;    public:      void f1(int i) {          this.a = i;      }  }

C++ 类中几个特别的地方

1) 可见性 private、protected、public

这几个关键字和 Java 是一样的，只不过在 C++ 中，通常不会对每个成员变量和方法进行可见性声明，而是将不同的可见性的变量和方法集中在一起，统一声明,具体见上面定义的类A。

2) 构造函数和析构函数

C++ 中类的构造函数和 Java 基本一致，只不过，在实现构造函数时，对成员变量的初始化方式比较特别。如下：

A::A(int a, int b):  a(a),  b(b) {    }    // 等价于    A::A(int a, int b) {      this.a = a;      this.b = b;  }

以上两种方式都可以，通常使用第一种方式。

析构函数 则是 Java 中没有的。通过波浪符号 ~ 进行标记。

它和构造函数一样，都是由系统自动调用，只不过，构造函数 在类创建的时候调用，析构函数 在类被删除的时候调用，主要用于释放内部变量和内存。

析构函数的声明形式为 ~类名();

实现的形式为 类名::~类名() { }

具体见上面类 A 的写法。

3) :: 双冒号

看了上面类的定义，肯定会对 :: 这个符号感到很神奇。这是 C++ 中的 域作用符，用于标示变量和方法是属于哪个域的，比如上面的

void A::a() { }

说明 方法a 是属于 类A 的。

也可以用于调用类的静态成员变量，如

//A.h    class A {  private:      static int a = 1;      int b;      void a();  }    //A.cpp  void A::a() {      b = A::a;  }

类的继承

C++ 类的继承和 Java 也是大同小异，其格式如下：

class B: access-specifier A，其中 access-specifier 是访问修饰符，是 public、protected 或 private 其中的一个。

访问修饰符的作用如下：

公有继承（public）：当一个类派生自公有基类时，基类的公有成员也是派生类的公有成员，基类的保护成员也是派生类的保护成员，基类的私有成员不能直接被派生类访问，但是可以通过调用基类的公有和保护成员来访问。

保护继承（protected）：当一个类派生自保护基类时，基类的公有和保护成员将成为派生类的保护成员。

私有继承（private）：当一个类派生自私有基类时，基类的公有和保护成员将成为派生类的私有成员。

通常情况下，我们都是使用 公有继承（public），也就是和 Java 是一样的。

类可以多继承

Java 中，子类只能继承一个父类，但是 C++ 可以继承自多个父类，使用逗号 , 隔开:

class <派生类名>:<继承方式1><基类名1>,<继承方式2><基类名2>,…  {  <派生类类体>  };

三、 C++ 指针

Java 中的 “指针”

Java 中，是没有指针的概念的，但是其实 Java 中除了基本数据类，大部分情况下使用都是 指针。

比如下面这段 Java 代码：

People p1 = new People("David","0001");  People p2 = p1;  p2.setName("Denny");  System.out.println(p1.getName());    // 输出结果为：Denny

原因就是 p1 和 p2 都是对对象的引用，在完成赋值语句 People p2 = p1; 后， p2 和 p1 指向同一个存储空间，所以对于p2的修改也影响到了p1。

那么，为什么在 Java 中很少去关注指针呢？

因为 Java 已经将指针封装了，也不允许显式地去操作指针，并且 Java 中的内存都由虚拟机进行管理，无需我们去释放申请的内存。

C++ 中的指针

1) 指针的声明和定义

与 Java 不同的是，C++ 中的指针概念非常重要，并且无处不在。

指针：是一个变量，这个变量的值是另一个变量的内存地址。也就是说，指针是一个指向内存地址的变量。

指针的声明和定义方法如下：

int a = 1; // 实际变量的声明    int *p; // 指针变量的声明    p = &a; // 指针指向 a 的内存地址    printf("p 指向的地址: %d, p指向的地址存储的内容: %dn", p, *p);    // 输出如下：  // p 指向的地址: -1730170860, p指向的地址存储的内容: 1

这个例子中有两个很重要的符号： * 、&。其中：

* ：有两个作用：

i. 用于定义一个指针： type *var_name; ，var_name 是一个指针变量，如 int *p;

ii. 用于对一个指针取内容： *var_name，如 *p 的值是 1。

& ：是一个取址符号

其用于获取一个变量所在的内存地址。如 &a; 的值是 a 所在内存的位置，即 a 的地址。

通过上面的例子，可能无法很好的理解指针的用处，来看另一个例子。

class A {  public:      int i;  };    int main() {        //-----1-------      A a = A(); // 定变量 a      a.i = 1;   // 修改 a 中的变量        A b = a;   // 定义变量 b ，赋值为 a        A *c = &a; // 定义指针 c，指向 a        printf("%d, %d, %dn", a.i, b.i, c->i);      // 输出：1, 1, 1        //-----2-------      b.i = 2; //修改 b 中的变量        printf("%d, %d, %dn", a.i, b.i, c->i);      // 输出：1, 2, 1        //-----3-------      c->i = 3; //修改 c 中的变量        printf("%d, %d, %dn", a.i, b.i, c->i);      // 输出：3, 2, 3        //-----4-------      // 打印地址      printf("%d, %d, %dn", &a, &b, c);      // 输出：-1861360224, -1861360208, -1861360224        return 0;  }

上面的例子，定义了一个变量 a ，然后将 a 分别赋值给普通变量 b 和指针变量 c。

第一次，打印三个变量中的成员变量的 i 的值都为 1；

第二次，修改了 b 中的 i，结果只修改了 b 的值，对 a 和 c 都没有影响；

第三次，修改了 c 中的 i，结果修改了 a 和 c 的值，对 b 都没有影响；

最后，打印了三个变量的地址，可以发现 a 和 c 的值是一样的，b 的地址不一样。

从这个例子就可以看出端倪了：

通过 普通变量 赋值的时候，系统创建了一个新的独立的内存块，如 b，对 b 的修改，只影响其本身；

通过 指针变量 赋值时，系统没有创建新的内存块，而是将指针指向了已存在的内存块，如 c ，任何对 c 的修改，都将影响原来的变量，如 a。

还有一点需要注意的是，指针变量 对成员变量的引用，使用的是箭头符号 ->，如 c->i ；普通变量对成员变量的引用，使用的是点符号 . ，如 b.i 。

2) new 和 delete

在上面的例子中，是通过创建了一个变量 a ，然后将指针变量 c 指向了 a 的方式定义了 c。还有另外一种方法，可以声明和定义一个指针变量，那就是通过 new 动态创建。

class A {  public:      int i;  }    int main() {      A *a = new A();      a->i = 0;        printf("%dn", a->i);      // 输出： 0        // 删除指针变量，回收内存      delete a;        return 0;  }

这就是动态创建指针变量的方式，这是 C++ 常用的方式。

重要提醒：

要注意的是，通过 new 的方式创建的指针变量和不通过 new 创建的变量最大的区别在于：通过 new 创建的指针需要我们自己手动回收内存，否则将会导致内存泄漏。回收内存则是通过 delete 关键字进行的。

也就是说，new 和 delete 必须要成对调用。

int main() {      A a = A(); // 无new，main 函数结束后，系统会自动回收内存        A *b = new A(); // new 方式创建，系统不会自动回收内存，要手动 delete        delete b; // 手动删除，回收内存        return 0;  }

可以看到，C++ 的指针变量其实更接近与 Java 中普通变量的使用方式。

四、C++ 引用

引用 是除了指针外，另一个非常重要的概念。在 C++ 也是经常使用的。

引用指的是：为一个变量起一个别名，也就是说，它是某个已存在变量的另一个名字。

引用和指针非常的相似，初学者非常容易把这两者混淆了。

引用的声明和定义

首先来看下如何声明一个引用变量。

// 声明一个普通变量 i  int i = 0;    // 声明定义一个引用 j  int &j = i;    j = 1;    printf("%d, %dn", i, j)    // 输出：1, 1

是不是有点熟悉，又是与符号 & ，但是这里并非表示取址，这里只是作为一个标示符号。

请记住，千万不要和取址符号混淆，取址表示方式是：A *p = &a;

在上面的例子中，修改了 j 的值，i 的值也发生了变化。这和指针是不是非常像？

那么，引用和指针有什么不一样呢？

i. 不存在空引用。引用必须连接到一块合法的内存。

ii. 一旦引用被初始化为一个对象，就不能被指向到另一个对象。指针可以在任何时候指向到另一个对象。

iii. 引用必须在创建时被初始化。指针可以在任何时间被初始化。

i 和 iii 都很好理解，就是声明引用的时候，必须要初始化好，并且不能初始化为空 NULL 。

ii 是最让人不理解的，什么叫做 “不能被指向到另一个对象” ?

引用和指针的区别

看以下的例子：

int i = 0;    // 定义引用 j ，指向 i  int &j = i;    int k = 1；    // 这个操作是指向另外一个对象吗？  j = k;    printf("%d, %d, %dn", i, j, k);  // 输出：1, 1, 1    // 打印地址  printf("%d, %d, %dn", &i, &j, &k);  // 输出：-977299952, -977299952, -977299948

可以看到，i j k 三个的值都变成了 1，这看起来和指针是一样的效果，但却有质的区别。

看最后一个打印输出，i 和 j 的地址始终是一样的，和 k 是不一样的。也就是说， j 始终指向 i ，不可改变。 j = k 只是把 k 的值给到了 j，同时也改变了 i 。

如果还不懂，再来看一下指针的例子，你就明白了。

int i = 0;    // 定义指针 j ，指向 i  int *j = &i;    int k = 1;    // 指向另一个对象  j = &k;    printf("%d, %d, %dn", i, *j, k);  // 输出：0, 1, 1    // 打印地址  printf("%d, %d, %dn", &i, j, &k);  // 输出：-1790365184, -1790365180, -1790365180

看到了吗？ j 在赋值了 &k 以后，地址就变成和 k 一样了，也就是说，指针 j 可以指向不同的对象。这时候， j 和 i 就没有任何关系了，i 的值也不会随着 j 改变而改变。

如何使用引用

引用最常出现的地方是作为函数的参数使用。

void change(int &i, int &j) {      int temp = i;      i = j;      j = temp;  }    int main() {      int i = 0;      int j = 1;        // 打印地址      printf("[before: %d, %d]n", &i, &j);      //输出：[before: -224237816, -224237812]        change(i, j);        printf("[i: %d, j: %d]n", i, j);      // 输出：i: 1, j: 0        // 打印地址      printf("[after: %d, %d]n", &i, &j);      // 输出：after: -224237816, -224237812        return 0;  }

在上面的例子中，change 方法的两个参数都是引用，和普通的参数有以下两个区别：

i. 引用参数不会创建新的内存块，参数只是对外部传进来的变量的一个引用。

ii. 引用参数可以改变外部变量的值。

这是普通变量的情况：

void change(int i, int j) {      int temp = i;      i = j;      j = temp;        // 打印地址      pritf("[change: %d, %d]n", &i, &j);      // 输出[change: -1136723044, -1136723048]  }    int main() {      int i = 0;      int j = 1;        // 打印地址      printf("[before: %d, %d]n", &i, &j);      //输出：[before: -224237816, -224237812]        change(i, j);        printf("[i: %d, j: %d]n", i, j);      // 输出：i: 0, j: 1        // 打印地址      printf("[after: %d, %d]n", &i, &j);      // 输出：after: -224237816, -224237812        return 0;  }

可以看到，i j 的值不会被改不变，原因是 change 方法创建了两个临时的局部变量，都有自己的内存块，这个变量的地址和外部传进来的变量是没有关系的，所以无法改变外部变量的值。

到这里，就可以看到参数引用的好处了：引用参数为我们节省了内存，执行效率也更快。

同样的，指针参数也有类似的效果，但是其仍然和引用有着本质的区别。引用为我们提供另一个种很好的传参选择。

有时候，我们并不想让函数内部改变外部变量的值，可以给参数加上常量的标志。

void change(const int &i, const int &j) {      int temp = i;      i = j;     // 不允许修改i，编译出错      j = temp;  // 不允许修改j，编译出错  }

五、C++ 多态和虚函数

多态 是面向对象的三大特点之一。

C++ 的多态和 Java 非常相似，但是也有着明显的不同。

静态绑定

看下面一个例子：

class A {  public:      void f() {          printf("an");      };  };    class B : public A {  public:      void f() {          printf("bn");      };  };    int main() {      A *a = new B();      a->f();      // 输出：a        return 0;  }

这里 B 继承了 A，并重写了方法 f 。

在 main 函数中，定义了一个基类变量指针 a ，并指向子类 B 。接着调用了 a 的方法 f。

如果是 Java 中类似的操作的话，那么毫无疑问，此处会输出 b，可是这里却输出了 a 。也就是说，这里方法 f 实际上是基类 A 的 f 方法。

这就是 C++ 和 Java 其中一个很大的不同。

原因是，调用函数 f() 被编译器设置为基类中的版本，这就是所谓的静态多态，或静态链接。

函数调用在程序执行前就准备好了。有时候这也被称为早绑定，因为 f() 函数在程序编译期间就已经设置好了。

那么如果想实现类似 Java 中的多态重载呢？

虚函数

virtual 是 C++ 中的一个关键字，用于声明函数，表示虚函数。用于告诉编译器不要静态链接到该函数，改为动态链接。

依然是上面的例子，在 A 的 f 函数上加上 virtual，将得到类似 Java 的效果：

class A {  public:      virtual void f() {          printf("an");      };  };    class B : public A {  public:      void f() {          printf("bn");      };  };    int main() {      A *a = new B();      a->f();      // 输出：b        return 0;  }

纯虚函数

在 Java 中，我们经常会使用 interface 或 abstract 来定义一些接口，方便代码规范和拓展，但是在 C++ 没有这样的方法，但是可以有类似的实现，那就是：纯虚函数。

class A {  public:      // 声明一个纯虚函数      virtual void f() = 0;  }    class B : public A {  public:      // 子类必须实现 f ，否则编译不通过      void f() {          printf("bn");      };  };    int main() {      A *a = new B();      a->f();      // 输出：b        return 0;  }

A 中的 virtual void f() = 0; 就是一个纯虚函数。如果继承 A，子类必须实现 f 这个接口，否则编译不通过。

A 则是一个抽象类。不能被直接定义使用。

六、C++ 预处理

在 C++ 中有一个方法，可以让我们在程序编译前，对代码做一些处理，称为预处理。这是 Java 中没有的，在 C++ 中却经常使用到。

预处理是一些指令，但是这些指令并不是 C++ 语句，所以不需要以分号 ; 结束。

所有的预处理语句都是以井号 # 开始的。

比如 #include 就是一个预处理，用于将其他文件导入到一个另一个文件中，类似 Java 的 import 。

例如导入头文件：

// A.h  class A{  public:      A();      ~A();  }

#include "A.h"    A::A() {    }    A::~A() {    }

在 C++ 中常用的预处理有以下几个 #include、 #define 、#if、#else 、 #ifdef 、 #endif 等。

宏定义

最常用的一个预处理语句 #define ，通常称为宏定义。

其形式为：

#define name replacement-text

#define PI 3.14159    printf("PI = %f", PI);    // 在编译之前，上面的语句被展开为：  // printf("PI = %f", 3.14159);

带参数宏定义

#define SUM(a,b) (a + b)    printf("a + b = %d", SUM(1, 2));    // 在编译之前，上面的语句被展开为：  // printf("a + b = %d", 1 + 2);  // 输出：a + b = 3

# 和 ## 运算符

在宏定义中，# 用于将参数 字符串化。

#define MKSTR( x ) #x    printf(MKSTR(Hello C++));    // 在编译之前，上面的语句被展开为：  // printf("Hello C++");  // 输出： Hello C++

在宏定义中，## 用于将参数 连接起来。

#define CONCAT(a, b) a ## b    int xy = 100;    printf("xy = %d", CONCAT(x, y));    // 在编译之前，上面的语句被展开为：  // printf("xy = %d", xy);  // 输出：xy = 100

注意：# 、 ## 在多个宏定义嵌套使用的时候，会导致不展开的问题

例如：

#define CONCAT(x, y) x ## y    #define A a    #define B b    void mian() {        char *ab = "ab";      char *AB = "AB";        printf("AB = %s", CONCAT(A, B));        // 在编译之前，上面的语句被展开为：      // printf("AB = %s", AB);  }

虽然定义了 A B 两个宏定义，但是在 CONCAT 中遇到 ## 的时候，A B 这两个宏定义是不会开展的，而是直接当作两个参数被连接起来了。

那么要如何解决这个问题呢？那就是再转接一层。

#define _CONCAT(x, y) x ## y  #define CONCAT(x, y) _CONCAT(x, y)    #define A a    #define B b    void mian() {        char *ab = "ab";      char *AB = "AB";        printf("AB = %s", CONCAT(A, B));        // 在编译之前，上面的语句被展开为：      // printf("AB = %s", _CONCAT(a, b));      // printf("AB = %s", ab);      // 输出：AB = ab  }

条件编译

#if、#else、 #ifdef、 #endif 这几个的组合主要用条件编译。

在 C++ 中条件编译也是经常使用到的，可以用来控制哪些代码参与编译，哪些不参与编译。

#define DEBUG    int main() {    #ifdef DEBUG      // 参与编译      printf("I am DEBUGn");  #else      // 不参与编译      printf("No DEBUGn");  #endif        return 0;  }    // 输出：I am DEBUG

以上代码，由于先前已经定义了 #define DEBUG 所以 #ifdef DEBUG 为 true ，编译 printf("I am DEBUGn"); 。

如果去掉 #define DEBUG ，则编译 printf("No DEBUGn"); 。

int main() {    #if 0      // 这里面的代码都被注释掉，不参与编译      printf("I am not compiledn");  #endif        return 0;  }

七、总结

以上，基本就是在 C++ 经常使用到的，与 Java 相似，又存在差异的一些基础知识，由于面向对象语言都存在一定的相似性，相信有了以上的基础之后，你就可以比较通畅地阅读一些 C++ 代码了。

如果你是一个 Java 程序员，可能对其中的一些知识还是会感到迷惑，这时候需要你抛弃 Java 中的一些惯有思维，重新细细品尝一下 C++ 的味道，可以实际的去敲一下代码来消化这些知识，只有实践才能出真知。