Rust入坑指南:智慧指針
- 2020 年 3 月 10 日
- 筆記
在了解了Rust中的所有權、所有權借用、生命周期這些概念後,相信各位坑友對Rust已經有了比較深刻的認識了,今天又是一個連環坑,我們一起來把智慧指針刨出來,一探究竟。
智慧指針是Rust中一種特殊的數據結構。它與普通指針的本質區別在於普通指針是對值的借用,而智慧指針通常擁有對數據的所有權。在Rust中,如果你想要在堆記憶體中定義一個對象,並不是像Java中那樣直接new一個,也不是像C語言中那樣需要手動malloc函數來分配記憶體空間。Rust中使用的是Box::new
來對數據進行封箱,而Box<T>
就是我們今天要介紹的智慧指針之一。除了Box<T>
之外,Rust標準庫中提供的智慧指針還有Rc<T>
、Ref<T>
、RefCell<T>
等等。在詳細介紹之前,我們還是先了解一下智慧指針的基本概念。
基本概念
我們說Rust的智慧指針是一種特殊的數據結構,那麼它特殊在哪呢?它與普通數據結構的區別在於智慧指針實現了Deref
和Drop
這兩個traits。實現Deref
可以使智慧指針能夠解引用,而實現Drop
則使智慧指針具有自動析構的能力。
Deref
Deref有一個特性是強制隱式轉換:如果一個類型T實現了Deref<Target=U>,則該類型T的引用在應用的時候會被自動轉換為類型U。
use std::rc::Rc; fn main() { let x = Rc::new("hello"); println!("{:?}", x.chars()); }
如果你查看Rc的源碼,會發現它並沒有實現chars()方法,但我們上面這段程式碼卻可以直接調用,這是因為Rc實現了Deref。
#[stable(feature = "rust1", since = "1.0.0")] impl<T: ?Sized> Deref for Rc<T> { type Target = T; #[inline(always)] fn deref(&self) -> &T { &self.inner().value } }
這就使得智慧指針在使用時被自動解引用,像是不存在一樣。
Deref的內部實現是這樣的:
#[lang = "deref"] #[doc(alias = "*")] #[doc(alias = "&*")] #[stable(feature = "rust1", since = "1.0.0")] pub trait Deref { /// The resulting type after dereferencing. #[stable(feature = "rust1", since = "1.0.0")] type Target: ?Sized; /// Dereferences the value. #[must_use] #[stable(feature = "rust1", since = "1.0.0")] fn deref(&self) -> &Self::Target; } #[lang = "deref_mut"] #[doc(alias = "*")] #[stable(feature = "rust1", since = "1.0.0")] pub trait DerefMut: Deref { /// Mutably dereferences the value. #[stable(feature = "rust1", since = "1.0.0")] fn deref_mut(&mut self) -> &mut Self::Target; }
DerefMut和Deref類似,只不過它是返回可變引用的。
Drop
Drop對於智慧指針非常重要,它是在智慧指針被丟棄時自動執行一些清理工作,這裡所說的清理工作並不僅限於釋放堆記憶體,還包括一些釋放文件和網路連接等工作。之前我總是把Drop理解成Java中的GC,隨著對它的深入了解後,我發現它比GC要強大許多。
Drop的內部實現是這樣的:
#[lang = "drop"] #[stable(feature = "rust1", since = "1.0.0")] pub trait Drop { #[stable(feature = "rust1", since = "1.0.0")] fn drop(&mut self); }
這裡只有一個drop方法,實現了Drop的結構體,在消亡之前,都會調用drop方法。
use std::ops::Drop; #[derive(Debug)] struct S(i32); impl Drop for S { fn drop(&mut self) { println!("drop {}", self.0); } } fn main() { let x = S(1); println!("create x: {:?}", x); { let y = S(2); println!("create y: {:?}", y); } }
上面程式碼的執行結果為
可以看到x和y在生命周期結束時都去執行了drop方法。
對智慧指針的基本概念就先介紹到這裡,下面我們進入正題,具體來看看每個智慧指針都有什麼特點吧。
Box
前面我們已經提到了Box
fn main() { let x = Box::new("hello"); println!("{:?}", x.chars()) }
我們可以看一下Box::new
的源碼
#[stable(feature = "rust1", since = "1.0.0")] #[inline(always)] pub fn new(x: T) -> Box<T> { box x }
可以看到這裡只有一個box關鍵字,這個關鍵字是用來進行堆記憶體分配的,它只能在Rust源碼內部使用。box關鍵字會調用Rust內部的exchange_malloc和box_free方法來管理記憶體。
#[cfg(not(test))] #[lang = "exchange_malloc"] #[inline] unsafe fn exchange_malloc(size: usize, align: usize) -> *mut u8 { if size == 0 { align as *mut u8 } else { let layout = Layout::from_size_align_unchecked(size, align); let ptr = alloc(layout); if !ptr.is_null() { ptr } else { handle_alloc_error(layout) } } } #[cfg_attr(not(test), lang = "box_free")] #[inline] pub(crate) unsafe fn box_free<T: ?Sized>(ptr: Unique<T>) { let ptr = ptr.as_ptr(); let size = size_of_val(&*ptr); let align = min_align_of_val(&*ptr); // We do not allocate for Box<T> when T is ZST, so deallocation is also not necessary. if size != 0 { let layout = Layout::from_size_align_unchecked(size, align); dealloc(ptr as *mut u8, layout); } }
Rc
在前面的學習中,我們知道Rust中一個值在同一時間只能有一個變數擁有其所有權,但有時我們可能會需要多個變數擁有所有權,例如在圖結構中,兩個圖可能對同一條邊擁有所有權。
對於這樣的情況,Rust為我們提供了智慧指針Rc
Rc
我們還是通過一個簡單的例子來看一下Rc
如果我們想要造一個「雙頭」的鏈表,如下圖所示,3和4都指向5。我們先來嘗試使用Box實現。
enum List { Cons(i32, Box<List>), Nil, } use crate::List::{Cons, Nil}; fn main() { let a = Cons(5, Box::new(Cons(10, Box::new(Nil)))); let b = Cons(3, Box::new(a)); let c = Cons(4, Box::new(a)); }
上述程式碼在編譯時就會報錯,因為a綁定給了b以後就無法再綁定給c了。
enum List { Cons(i32, Rc<List>), Nil, } use crate::List::{Cons, Nil}; use std::rc::Rc; fn main() { let a = Rc::new(Cons(5, Rc::new(Cons(10, Rc::new(Nil))))); let b = Cons(3, Rc::clone(&a)); let c = Cons(4, Rc::clone(&a)); println!("count a {}", Rc::strong_count(&a)); }
這時我們可以看到a的引用計數是3,這是因為這裡計算的是節點5的引用計數,而a本身也是對5的一次綁定。這種通過clone方法共享所有權的引用稱作強引用。
Rust還為我們提供了另一種智慧指針Weak
RefCell
前文中我們聊過變數的可變性和不可變性,主要是針對變數的。按照前面所講的,對於結構體來說,我們也只能控制它的整個實例是否可變。實例的具體某個成員是否可變我們是控制不了的。但在實際開發中,這樣的場景也是比較常見的。比如我們有一個User結構體:
struct User { id: i32, name: str, age: u8, }
通常情況下,我們只能修改一個人的名稱或者年齡,而不能修改用戶的id。如果我們把User的實例設置成了可變狀態,那就不能保證別人不會去修改id。
為了應對這種情況,Rust為我們提供了Cell<T>
和RefCell<T>
。它們本質上不屬於智慧指針,而是可以提供內部可變性的容器。內部可變性實際上是一種設計模式,它的內部是通過一些unsafe
程式碼來實現的。
我們先來看一下Cell<T>
的使用方法吧。
use std::cell::Cell; struct Foo { x: u32, y: Cell<u32>, } fn main() { let foo = Foo { x: 1, y: Cell::new(3)}; assert_eq!(1, foo.x); assert_eq!(3, foo.y.get()); foo.y.set(5); assert_eq!(5, foo.y.get()); }
我們可以使用Cell的set/get方法來設置/獲取起內部的值。這有點像我們在Java實體類中的setter/getter方法。這裡有一點需要注意:Cell<T>
中包裹的T必須要實現Copy才能夠使用get方法,如果沒有實現Copy,則需要使用Cell提供的get_mut方法來返回可變借用,而set方法在任何情況下都可以使用。由此可見Cell並沒有違反借用規則。
對於沒有實現Copy的類型,使用Cell<T>
還是比較不方便的,還好Rust還提供了RefCell<T>
。話不多說,我們直接來看程式碼。
use std::cell::RefCell; fn main() { let x = RefCell::new(vec![1, 2, 3]); println!("{:?}", x.borrow()); x.borrow_mut().push(5); println!("{:?}", x.borrow()); }
從上面這段程式碼中我們可以觀察到RefCell<T>
的borrow_mut和borrow方法對應了Cell<T>
中的set和get方法。
RefCell<T>
和Cell<T>
還有一點區別是:Cell<T>
沒有運行時開銷(不過也不要用它包裹大的數據結構),而RefCell<T>
是有運行時開銷的,這是因為使用RefCell<T>
時需要維護一個借用檢查器,如果違反借用規則,則會引起執行緒恐慌。
總結
關於智慧指針我們就先介紹這麼多,現在我們簡單總結一下。Rust的智慧指針為我們提供了很多有用的功能,智慧指針的一個特點就是實現了Drop
和Deref
這兩個trait。其中Drop
trait中提供了drop方法,在析構時會去調用。Deref
trait提供了自動解引用的能力,讓我們在使用智慧指針的時候不需要再手動解引用了。
接著我們分別介紹了幾種常見的智慧指針。Box<T>
可以幫助我們在堆記憶體中分配值,Rc<T>
為我們提供了多次借用的能力。RefCell<T>
使內部可變性成為現實。
最後再多說一點,其實我們以前見到過的String
和Vec
也屬於智慧指針。
至於它們為什麼屬於智慧指針,Rust又提供了哪些其他的智慧指針呢?這裡就留個坑吧,感興趣的同學可以自己踩一下。