【从今天开始好好学数据结构01】数组

2019 年 11 月 15 日
笔记

面试的时候，常常会问数组和链表的区别，很多人都回答说，“链表适合插入、删除，时间复杂度O(1)；数组适合查找，查找时间复杂度为O(1)”。实际上，这种表述是不准确的。数组是适合查找操作，但是查找的时间复杂度并不为O(1)。即便是排好序的数组，你用二分查找，时间复杂度也是O(logn)。所以，正确的表述应该是，数组支持随机访问，根据下标随机访问的时间复杂度为O(1)。

每一种编程语言中，基本都会有数组这种数据类型。不过，它不仅仅是一种编程语言中的数据类型，还是一种最基础的数据结构。尽管数组看起来非常基础、简单，但是我估计很多人都并没有理解这个基础数据结构的精髓。在大部分编程语言中，数组都是从0开始编号的，但你是否下意识地想过，为什么数组要从0开始编号，而不是从1开始呢？ 从1开始不是更符合人类的思维习惯吗？带着这个问题来学习接下来的内容,带着问题去学习往往效果会更好！！！

什么是数组？我估计你心中已经有了答案。不过，我还是想用专业的话来给你做下解释。数组（Array）是一种线性表数据结构。它用一组连续的内存空间，来存储一组具有相同类型的数据。这个定义里有几个关键词，理解了这几个关键词，我想你就能彻底掌握数组的概念了。下面就从我的角度分别给你“点拨”一下。

第一是线性表（Linear List）。顾名思义，线性表就是数据排成像一条线一样的结构。每个线性表上的数据最多只有前和后两个方向。其实除了数组，链表、队列、栈等也是线性表结构。而与它相对立的概念是非线性表，比如二叉树、堆、图等。之所以叫非线性，是因为，在非线性表中，数据之间并不是简单的前后关系。

第二个是连续的内存空间和相同类型的数据。正是因为这两个限制，它才有了一个堪称“杀手锏”的特性：“随机访问”。但有利就有弊，这两个限制也让数组的很多操作变得非常低效，比如要想在数组中删除、插入一个数据，数组为了保持内存数据的连续性，会导致插入、删除这两个操作比较低效,相反的数组查询则高效

数组java代码：

package array;    /**   * 1) 数组的插入、删除、按照下标随机访问操作；   * 2）数组中的数据是int类型的；   *   * Author: Zheng   * modify: xing, Gsealy   */  public class Array {      //定义整型数据data保存数据      public int data[];      //定义数组长度      private int n;      //定义中实际个数      private int count;        //构造方法，定义数组大小      public Array(int capacity){          this.data = new int[capacity];          this.n = capacity;          this.count=0;//一开始一个数都没有存所以为0      }        //根据索引，找到数据中的元素并返回      public int find(int index){          if (index<0 || index>=count) return -1;          return data[index];      }        //插入元素:头部插入，尾部插入      public boolean insert(int index, int value){          //数组中无元素            //if (index == count && count == 0) {          //    data[index] = value;          //    ++count;          //    return true;          //}            // 数组空间已满          if (count == n) {              System.out.println("没有可插入的位置");              return false;          }          // 如果count还没满，那么就可以插入数据到数组中          // 位置不合法          if (index < 0||index > count ) {              System.out.println("位置不合法");              return false;          }          // 位置合法          for( int i = count; i > index; --i){              data[i] = data[i - 1];          }          data[index] = value;          ++count;          return true;      }      //根据索引，删除数组中元素      public boolean delete(int index){          if (index<0 || index >=count) return false;          //从删除位置开始，将后面的元素向前移动一位          for (int i=index+1; i<count; ++i){              data[i-1] = data[i];          }          //删除数组末尾元素  这段代码不需要也可以          /*int[] arr = new int[count-1];          for (int i=0; i<count-1;i++){              arr[i] = data[i];          }          this.data = arr;*/            --count;          return true;      }      public void printAll() {          for (int i = 0; i < count; ++i) {              System.out.print(data[i] + " ");          }          System.out.println();      }        public static void main(String[] args) {          Array array = new Array(5);          array.printAll();          array.insert(0, 3);          array.insert(0, 4);          array.insert(1, 5);          array.insert(3, 9);          array.insert(3, 10);          //array.insert(3, 11);          array.printAll();      }  }

GenericArray数组代码

public class GenericArray<T> {      private T[] data;      private int size;        // 根据传入容量，构造Array      public GenericArray(int capacity) {          data = (T[]) new Object[capacity];          size = 0;      }        // 无参构造方法，默认数组容量为10      public GenericArray() {          this(10);      }        // 获取数组容量      public int getCapacity() {          return data.length;      }        // 获取当前元素个数      public int count() {          return size;      }        // 判断数组是否为空      public boolean isEmpty() {          return size == 0;      }        // 修改 index 位置的元素      public void set(int index, T e) {          checkIndex(index);          data[index] = e;      }        // 获取对应 index 位置的元素      public T get(int index) {          checkIndex(index);          return data[index];      }        // 查看数组是否包含元素e      public boolean contains(T e) {          for (int i = 0; i < size; i++) {              if (data[i].equals(e)) {                  return true;              }          }          return false;      }        // 获取对应元素的下标, 未找到，返回 -1      public int find(T e) {          for ( int i = 0; i < size; i++) {              if (data[i].equals(e)) {                  return i;              }          }          return -1;      }          // 在 index 位置，插入元素e, 时间复杂度 O(m+n)      public void add(int index, T e) {          checkIndex(index);          // 如果当前元素个数等于数组容量，则将数组扩容为原来的2倍          if (size == data.length) {              resize(2 * data.length);          }            for (int i = size - 1; i >= index; i--) {              data[i + 1] = data[i];          }          data[index] = e;          size++;      }        // 向数组头插入元素      public void addFirst(T e) {          add(0, e);      }        // 向数组尾插入元素      public void addLast(T e) {          add(size, e);      }        // 删除 index 位置的元素，并返回      public T remove(int index) {          checkIndexForRemove(index);            T ret = data[index];          for (int i = index + 1; i < size; i++) {              data[i - 1] = data[i];          }          size --;          data[size] = null;            // 缩容          if (size == data.length / 4 && data.length / 2 != 0) {              resize(data.length / 2);          }            return ret;      }        // 删除第一个元素      public T removeFirst() {          return remove(0);      }        // 删除末尾元素      public T removeLast() {          return remove(size - 1);      }        // 从数组中删除指定元素      public void removeElement(T e) {          int index = find(e);          if (index != -1) {              remove(index);          }      }        @Override      public String toString() {          StringBuilder builder = new StringBuilder();          builder.append(String.format("Array size = %d, capacity = %d n", size, data.length));          builder.append('[');          for (int i = 0; i < size; i++) {              builder.append(data[i]);              if (i != size - 1) {                  builder.append(", ");              }          }          builder.append(']');          return builder.toString();      }          // 扩容方法，时间复杂度 O(n)      private void resize(int capacity) {          T[] newData = (T[]) new Object[capacity];            for (int i = 0; i < size; i++) {              newData[i] = data[i];          }          data = newData;      }        private void checkIndex(int index) {          if (index < 0 || index > size) {              throw new IllegalArgumentException("Add failed! Require index >=0 and index <= size.");          }      }        private void checkIndexForRemove(int index) {          if(index < 0 || index >= size) {              throw new IllegalArgumentException("remove failed! Require index >=0 and index < size.");          }      }  }

到这里，就回溯最初的问题：

从数组存储的内存模型上来看，“下标”最确切的定义应该是“偏移（offset）”。前面也讲到，如果用a来表示数组的首地址，a[0]就是偏移为0的位置，也就是首地址，a[k]就表示偏移k个type_size的位置，所以计算a[k]的内存地址只需要用这个公式：

a[k]_address = base_address + k * type_size

但是，如果数组从1开始计数，那我们计算数组元素a[k]的内存地址就会变为：

a[k]_address = base_address + (k-1)*type_size

对比两个公式，我们不难发现，从1开始编号，每次随机访问数组元素都多了一次减法运算，对于CPU来说，就是多了一次减法指令。那你可以思考一下，类比一下，二维数组的内存寻址公式是怎样的呢？有兴趣的可以在评论区评论出来哦QAQ

数组作为非常基础的数据结构，通过下标随机访问数组元素又是其非常基础的编程操作，效率的优化就要尽可能做到极致。所以为了减少一次减法操作，数组选择了从0开始编号，而不是从1开始。
不过我认为，上面解释得再多其实都算不上压倒性的证明，说数组起始编号非0开始不可。所以我觉得最主要的原因可能是历史原因。

关于数组，它可以说是最基础、最简单的数据结构了。数组用一块连续的内存空间，来存储相同类型的一组数据，最大的特点就是支持随机访问，但插入、删除操作也因此变得比较低效，平均情况时间复杂度为O(n)。在平时的业务开发中，我们可以直接使用编程语言提供的容器类，但是，如果是特别底层的开发，直接使用数组可能会更合适。

如果本文对你有一点点帮助，那么请点个赞呗，谢谢~

最后，若有不足或者不正之处，欢迎指正批评，感激不尽！如果有疑问欢迎留言，绝对第一时间回复！

欢迎各位关注我的公众号，一起探讨技术，向往技术，追求技术，说好了来了就是盆友喔…

【从今天开始好好学数据结构01】数组

VirMach 便宜 VPS

QNews

【从今天开始好好学数据结构01】数组

分享此文：

Related Posts

Vue路由

Windows 系统 PostgreSQL 手工安装配置方法

微软老兵的23年 沈向洋留下了什么？

小朋友的家庭私教 华为平板M6“儿童乐园”深度体验

VirMach 便宜 VPS

QNews

热门文章

热门搜寻

微软老兵的23年沈向洋留下了什么？

小朋友的家庭私教华为平板M6“儿童乐园”深度体验