手把手教你造輪子:這個價值100萬的短網址微服務,我送給你

我是@程序員小助手, 本文從技術角度,對短網址進行深度挖掘。

前言

網上已經有產品,用着還不錯。可是,作為程序員,從零開始造輪子,開發一個屬於自己的短網址服務器,這想法amazing!

通過本文,讀者可明白短網址的技術原理,以及通過Go語言實現一個短網址服務

簡明教程

短網址為什麼存在?

微博等產品的興起,活躍了網上的社交圈內大多數用戶。但是微博一般有140字限制,如果不轉發,單純評論文字,再加上一段網址,極有可能超過限制而被截斷

短網址應運而生,用較短的一個字符串,替換較長的一個字符串,從觀感上講,效果要友好的多。

從技術原理上說,短網址是一個hash表,用於映射兩個字符串的對應關係。

使用鍵,找到對應的值,重定向進行訪問,就完成了整個流程。

短網址算法

短網址的一般結構,比如新浪的 SwuTjn,其中後端的一段6位字符串,就是用來唯一標記一條記錄的ID。那麼,使用什麼算法,可以生成一條無重複的ID呢?

使用通用的做法,使用 0-9 A-Z a-z 一共62個字符,我們看使用hash鍵位數分別有多少種排列組合情況。

  • 1位:pow(62,1) = 62 種
  • 2位:pow(62,2) = 3844 種
  • 3位:pow(62,3) = 238328 種
  • 4位:pow(62,4) = 14776336 種
  • 5位:pow(62,5) = 916132832 種
  • 6位:pow(62,6) = 56800235584 種

一般情況下,6個字符,就足夠使用了,共計568億種可能。

還有一種情況是,用原網址字符串的MD5值,共計32位,然後通過切分為4段,分別按位與運算,並裁剪到30位。間隔5位選出該位的字符作為該段索引,共有6位。但是這種做法也有幾率發生重複,也不直觀

因此本文使用第一種算法生成鍵ID。

工具準備

分析短網址的特性,包含以下項目:

  1. 唯一性:鍵需要全局唯一
  2. 時效性:鍵需要有過期時間
  3. 目標網址唯一,如果重複,則自動返回既有的鍵。

考慮到上述情形,我們使用redis存儲這些對應關係。使用Gin框架作為路由和控制器,提供對外的API訪問。

核心函數

計算機中常見的2進制,8進制,10進制,16進制,我們此處需要使用62個字符,循環表示一個整數,那麼可稱之為62進制。

下面使用go語言實現這個函數,用於將任意的整數(uint64)轉換為(0-9A-Za-z)的字符串。

需要注意,基礎的方法,就是循環取餘數,根據進制字典,索引相應的字符,然後將各個餘數拼接出來,就是結果。

這個計算方法,與2進制,8進制,原理是相同的。

由於字典比較長,有62個鍵值對,我們僅列出一部分。

上述函數的轉換結果,類似於 6489264001 = 75ai0p

功能規劃

下面是對於系統路由,創建短鏈接,以及使用短鏈接訪問目標網址的方法。

1 – 規劃路由

路由比較簡單,一共2個,一個POST方法,生成短鏈接;一個是GET方法,訪問短鏈接。

代碼如下:

2 – 引入redis並初始化

為了方便演示,我們使用redis存儲鍵值,並設置expire時間。

"github.com/gin-gonic/gin"

"github.com/go-redis/redis/v7"

我們使用go-redis提供的接口操作redis數據庫。

下面是全局的 redis.Client 對象生成,和初始化函數。

這樣做的好處是,我們全局都可以使用變量 rdb 調用方法操作redis鍵值。

3 – 實現POST路由方法:add

本函數用於接收form表單數據,生成一個全局唯一的 hash ,作為鍵,存入redis,設置值和過期時間。

代碼如下:

本段我們使用了一個 getCounter 函數,這是設置在redis內的鍵,將其每次請求創建的時候,自增+1,可保證無重複。根據這個計數器,我們調用 helper的 DecToAny 方法,將其轉化為62進制的字符串,作為全局唯一的 hash 值。

下圖是 getCounter 的定義:

特別注意的是,helper包,就是我們在「核心函數」部分定義的函數。在主函數體內引用。

4 – 實現GET方法:visit

本函數主要用於使用上一節接口生成的短鏈接,進行訪問,並自動重定向到目標網址。

代碼如下:

對於不存在的短鏈接,或者redis獲取失敗,返回錯誤信息。

如果存在,使用 301 = StatusMovedPermanently 狀態碼重定向到目標地址。

測試

我們使用curl工具,測試上述兩個接口。

首先,使用POST表單提交數據:

curl -s -X POST -d "target=https://httpbin.org/ip" -d "expire=600" http://localhost:9090/

上述方法,我們提交了兩個參數,命中路由之後,會訪問上一節第3條的add方法,並生成一個短鏈接網址。返回JSON格式數據如下:

{"message":"ok","short_url":"http://localhost:9090/75ai0r","status":1}

其中,short_url 就是短網址。

接着,我們在使用curl訪問這個鏈接,看是否發生重定向。截圖如下:

可以看到,執行了301重定向,並給出了目標網址,與我們上述表單想要創建的地址一致。

最後,故障測試。訪問一個不存在的hash,看是否排除異常信息。截圖如下:

可以看到,執行了錯誤返回信息

結語

以上我們使用GO語言框架Gin實現了兩個路由,並使用redis管理短鏈接。核心函數使用helper包管理,經過測試,實現了短網址的功能

以上代碼在本地測試通過,也可部署到線上服務器對外開發端口,提供服務,效果是一樣的。

希望通過這個流程,使大家對於短網址的知識,有一些了解,並能根據自身的編程能力,創作出更好用的短網址服務

Happy coding 🙂