你真的會高效的在GitHub搜索開源項目嗎?
- 2019 年 11 月 5 日
- 筆記
作者:侯樹成
GitHub的流行, GitHub在開源世界的受歡迎程度自不必多言。再加上今天,GitHub官方又搞了個大新聞:私有倉庫也改為免費使用,這在原來可是需要真金白銀的買的。可見微軟收購後,依然沒有改變 GitHub 的定位,甚至還更進一步。
花開兩朵,各表一枝。我們今天想要聊的並不是 GitHub 多麼重要,而是要說一下 GitHub 的搜索功能。
你在 GitHub上搜索程式碼時,是怎麼樣操作的呢?是不是也是像我這樣,直接在搜索框里輸入要檢索的內容,然後不斷在列表裡翻頁找自己需要的內容?

或者是簡單篩選下,在左側加個語言的過濾項。

再或者改變一下列表的排序方式

這就是「全部」了嗎?
一般的系統檢索功能,都會有一個「高級搜索」的功能。需要在另外的介面里展開,進行二次搜索之類的。 GitHub 有沒有類似的呢?
答案是「肯定的」。做為一個為萬千工程師提供服務的網站,不僅要有,而且還要技術范兒。
如果我們自己開發一個類似的應用,會怎樣實現呢?
帶著思路,咱們一起來看看,GitHub 是怎樣做的。
這裡我們假設正要學習 Spring Cloud,要找一個 Spring Cloud 的 Demo 參考練手。
1. 明確搜索倉庫標題、倉庫描述、README
GitHub 提供了便捷的搜索方式,可以限定只搜索倉庫的標題、或者描述、README等。
以Spring Cloud 為例,一般一個倉庫,大概是這樣的

其中,紅色箭頭指的兩個地方,分別是倉庫的名稱和描述。咱們可以直接限定關鍵字只查特定的地方。比如咱們只想查找倉庫名稱包含 spring cloud 的倉庫,可以使用語法
in:name 關鍵詞

如果想查找描述的內容,可以使用這樣的方式:
in:descripton 關鍵詞

這裡就是搜索上面項目描述的內容。
一般項目,都會有個README文件,如果要查該文件包含特定關鍵詞的話,我想你猜到了
in:readme 關鍵詞
2. 明確搜索 star、fork 數大於多少的
一個項目 star 數的多少,一般代表該項目有受歡迎程度。雖然現在也有垃圾項目刷 star ,但畢竟是少數, star 依然是個不錯的衡量標準。
stars: > 數字 關鍵字。
比如咱們要找 star 數大於 3000 的Spring Cloud 倉庫,就可以這樣
stars:>3000 spring cloud

如果不加 >= 的話,是要精確找 star 數等於具體數字的,這個一般有點困難。
如果要找在指定數字區間的話,使用
stars: 10..20 關鍵詞
fork 數同理,將上面的 stars 換成 fork,其它語法相同

3. 明確搜索倉庫大小的
比如你只想看個簡單的 Demo,不想找特別複雜的且佔用磁碟空間較多的,可以在搜索的時候直接限定倉庫的 size 。
使用方式:
size:>=5000 關鍵詞
這裡注意下,這個數字代表K, 5000代表著5M。
4. 明確倉庫是否還在更新維護
我們在確認是否要使用一些開源產品,框架的時候,是否繼續維護是很重要的一點。如果已經過時沒人維護的東西,踩了坑就不好辦了。而在 GitHub 上找項目的時候,不再需要每個都點到項目里看看最近 push 的時間,直接在搜索框即可完成。
元旦剛過,比如咱們要找臨近年底依然在勤快更新的項目,就可以直接指定更新時間在哪個時間前或後的
通過這樣一條搜索 pushed:>2019-01-03 spring cloud
咱們就找到了1月3號之後,還在更新的項目。

你是想找指定時間之前或之後創建的倉庫也是可以的,把 pushed 改成 created 就行。
5. 明確搜索倉庫的 LICENSE
咱們經常使用開源軟體,一定都知道,開源軟體也是分不同的「門派」不同的LICENSE。開源不等於一切免費,不同的許可證要求也大不相同。 2018年就出現了 Facebook 修改 React 的許可協議導致各個公司紛紛修改自己的程式碼,尋找替換的框架。
例如咱們要找協議是最為寬鬆的 Apache License 2 的程式碼,可以這樣
license:apache-2.0 spring cloud

其它協議就把apache-2.0替換一下即可,比如換成 mit 之類的。
6. 明確搜索倉庫的語言
比如咱們就找 Java 的庫, 除了像上面在左側點擊選擇之外,還可以在搜索中過濾。像這樣:
language:java 關鍵詞
7.明確搜索某個人或組織的倉庫
比如咱們想在 GitHub 上找一下某個大神是不是提交了新的功能,就可以指定其名稱後搜索,例如咱們看下 Josh Long 有沒有提交新的 Spring Cloud 的程式碼,可以這樣使用
user:joshlong

組合使用一下,把 Java 項目過濾出來,多個查詢之間「空格」分隔即可。
user:joshlong language:java

找某個組織的程式碼話,可以這樣:
org:spring-cloud 就可以列出具體org 的倉庫。

這個搜索使用起來是不是相當的便捷? 比起直接搜一個關鍵詞不停的翻頁點開找效率高多了吧。