基於模糊數學的「拍照賺錢」任務定價最優方案研究
- 2020 年 8 月 24 日
- 筆記
基於模糊數學的「拍照賺錢」任務定價最優方案研究
摘要
隨著移動互聯網的快速發展,越來越多的企業將大量線上、線下需求分解成微型兼職任務給廣泛的大眾執行,這樣能夠快速解決企業的彈性勞務需求,同時用戶也能通過手機輕鬆賺錢。「拍照賺錢」APP就是其中的典型代表。本文利用附件相關數據,分析空間任務分布密度、任務供需情況、任務完成率等指標,建立綜合吸引力模型,給出不同任務分布密度下的最優定價方案。我們的主要工作如下:
問題一要求給出任務定價規律,並給出任務失敗原因。我們對附件一中所數據進行分析,將任務分布區域(經度 ,緯度 )劃分為 個子區域,統計每一子區域的任務密度和任務平均定價並擬合出任務密度與定價間的數學關係。此外,我們將所給數據分為成功組和失敗組並分別做出其任務分布密度和任務定價散點圖和等高線圖,對比分析任務失敗原因。觀察得失敗組任務分布主要集中於經度 、緯度 以及經度 、緯度 這兩個範圍間,且定價較低。此外結合附件二會員位置資訊和任務請求上限,分析成功組和失敗組各子區域的任務供需匹配度發現失敗組供大於需,缺少完成任務會員。最終總結出任務失敗的原因有以下三點:(1)地理位置的原因;(2)定價及定價隨任務密度增加的變化速率的大小;(3)任務密度與附近會員的數目的匹配程度。
問題二要求給出新的定價方案,並對其做出評價。對此我們根據模糊數學中隸屬函數的方法,從會員心理層面出發,研究任務定價對會員的吸引力。查閱資料知當任務定價為68.56時吸引力達到0.5,該定價合理。此外我們根據會員信譽值對吸引力函數進行修正,綜合考慮定價對公司成本,會員吸引力和任務難易度這三項指標的影響,利用熵值取權法確定各項指標權重,構建綜合吸引力模型。通過實碼加速遺傳演算法求解得任務最優定價為73.2,並利用該定價修正任務密度與定價間的函數關係,得到不同位置的任務定價。為確定該方案的合理性,我們利用附件一所給任務資訊構建樸素貝葉斯分類器,判斷該方案任務完成情況。經檢驗分類器準確率達到100%,且新方案下任務完成率提高了約20%,達到82.2%,該方案合理可行。
問題三要求給出任務打包發布是的任務定價方案,並分析該方案對任務完成情況的影響。對此我們按照每3份任務進行打包,經分析知任務打包發布會增加會員日均任務完成量、提高任務完成率且為公司節約成本。在相同吸引力值的情況下,單筆任務定價減少為60,對此我們修正綜合吸引力函數,給出不同位置處的任務定價,並利用貝葉斯分類器對其進行檢驗。該方案下任務完成率達到85.4%,有明顯提高。
問題四要求給出新項目的定價方案並評價其效果。我們將任務分布空間化分為 個子區域,分析知任務主要集中在少數幾個區域。求解每個子區域的任務密度,並將問題二中的最優定價作為任務定價均值,確定不同任務密度下補貼方案。經檢驗該定價方案任務完成率達到79.4%,該方案合理可行。
關鍵詞:任務定價方案、任務分布密度、吸引力函數、樸素貝葉斯分類器
一、 問題重述
傳統的產品鋪貨率調查一般是由市場調查公司來做的,如果是全國性的鋪貨率調查項目,一般情況甲方會委託一個全國性的市場調查公司來進行。然而隨著移動互聯網的普及,一種基於移動互聯網的商業檢查領域的自主式兼職勞務分包平台正在蓬勃發展,其中「拍拍賺」就是典型代表[1]。與傳統市場調查方式相比此方式具有數據採集過程更加高效、總體品質更加有保障、成本更加有競爭力等特點[2]。在這樣的背景下,公司如何更為合理高效的管理平台上運行的APP成為了工作的中點,而APP中的任務定價又關係到任務的完成率,直接決定了公司的收益和APP的普及程度。因此任務定價是整個環節的關鍵因素。
基於以上背景,利用附件提供數據,建立數學模型研究如下問題:
- 給出合適的模型來反映附件一中項目的任務定價規律,並基於該模型分析任務未完成的原因。
- 依據不同指標給出新的定價方案,並與原來的定價方案比較分析其可行性。
- 建立任務打包發布時的定價模型,並分析在這種方案下的任務完成情況。
- 根據上文的定價方案模型對附件三中的新項目給出任務定價方案,並評價該方案的實施效果。
二、模型假設
- 假設附件所給數據均真實、可信。
- 假設附件一和附件二中所給數據來自同一段時間、或時間相差不多。
- 研究時間段,平台運行正常,任務和會員的數量及分布密度沒有太大變化。
- 附件中所給任務均能被用戶預定。
- 會員可通過APP得知周圍所有任務分布情況。
三、符號及變數說明
符號 | 說明 |
---|---|
中等文本 | |
短文本 |
四、問題分析
4.1 問題一的分析
問題一要求確定任務的定價規律並分析任務失敗的原因。我們首先對附件一所給數據進行預處理,檢查是否存在錯誤數據和空缺數據。然後根據數據確定任務分布的大致區域並將其劃分為20個子區域,觀察每一子區域的任務分布情況。通過統計所得每一子區域的任務密度和該子區域的任務定價均值來尋求任務定價與任務分布密度的關係。此外我們利用附件二所給會員位置資訊分析成功組、失敗組每一子區域的任務供需匹配度,同時對比任務成功組和失敗組任務分布的區域、任務密度、任務定價均值來尋求任務失敗原因。
4.2 問題二的分析
問題二要求給出行的任務定價方案,並分析方案的可行性。方案定價是否合理可行涉及到多方的博弈,會員希望任務簡單、定價高,而公司則希望利潤大、任務完成率高。為此我們同時考慮公司成本、任務完成率和任務定價對會員吸引力,建立綜合吸引力模型求解任務最優定價均值,並根據問題一所得結果給出不同任務分布密度下的任務定價。在此過程中我們充分考慮雙方的利益以實現多贏。對於任務定價的可行性分析,選擇附件一中任務成功組數據作為訓練樣本,構建樸素貝葉斯分類器求解新的定價下任務完成率,討論方案是否可行。
4.3 問題三的分析
問題三要求確定任務打包發布時的定價,並分析此方式下任務的完成情況。對此我們將每三個任務進行打包,分析任務打包發布時對會員吸引力的變化,修正上文所給的任務定價吸引力隸屬函數,重新求解任務的最優定價。並給出不同任務分布密度下的定價。利用上文訓練好的樸素貝葉斯分類器確定任務完成率,分析任務完成情況。
4.4問題四的分析
問題四要求對附件三中新的任務數據給出定價方案,並分析其可行性。對此我們對附件三所給數據進行預處理,並分析任務分布大致區域和每個子區域任務的密度。依據上文確定的任務分布密度與定價間的函數關係給出新任務的定價。利用樸素貝葉斯分類器對任務完成情況進行分析。
五、模型的建立與求解
5.1 根據任務分布密度分析定價規律和任務失敗原因
由附件一所給數據知,「拍照賺錢」任務的分布情況(經度和緯度)和任務的定價存在一定的聯繫。而任務的分布規律和定價又決定著任務的完成情況。因此本文通過對所給數據進行分析、預處理,利用數據挖掘技術[3]分析其任務定價的原因和任務失敗的情況。
5.1.1 數據的預處理
對附件一中所給數據進行預處理。統計個定價的數目及其所佔比例做餅狀圖如下所示。
如圖1.1和表1.1所示,任務的定價分布在 這個區間內,且定價在 這個範圍內的數據約佔51%。而定價在80以上的數據僅佔4.8%。定價主要集中於65,65.5,66,66.5,70和75這幾個數中。其它定價相對較少。
5.1.2 定價的標準化處理
由於定價數值相對較大,不便分析和處理,且為消除不同定價間維度的影響我們對數據進行標準化處理。
數據的標準化是指將數據按比例縮放,使之落到一個較小的特定區間。若落到0-1區間,即為數據的歸一化處理通過歸一化處理除去數據的單位限制,將其轉化為無量綱的純數值。在進行數據的分類和處理中便於不同單位或量級的指標能夠進行比較判別。
\(MIN-MAX\)標準化
\(MIN-MAX\)標準化是對原始數據的線性變化。設 分別為屬性 的最小值和最大值,將 的一個原始值 ,通過 標準化將其映射在區間[0,1]中的值 ,其公式為:
\]
若選擇均值方差標準化將會有負值出現,與定價的含義矛盾,故我們選擇 標準化。我們將任務的橫縱坐標作為x軸和y軸,將標準化後的任務定價作為z軸,做出任務分布與定價的三維散點圖,peak圖及等高線圖如下所示。
如上圖所示在經度 113.2~114.2,緯度 22.5~23.5這個範圍內任務較為集中,故其定價較低。而任務較為分散的區域定價往往較低。
為量化任務分布密度與任務定價間的對應關係,尋求兩者間的內在關聯,我們建立基於任務分布密度的定價模型。
5.1.3 分析任務分布密度與任務定價間的數學聯繫
任務分布密度的表達式如下所示
\]
其中 \(m_i\)為第\(i\)區域的任務密度
\(n_i\)為第i區域的任務數量
N為該區域內的總任務數
由附件一所給數據知,該任務分布的區域在經度 ,維度 這個矩形區域內。為統計不同子區域的任務分布密度,我們取經、緯度步的長為0.04,將該正方形區域劃分為5*4的小格。其中,每一個小格代表一個子區域,統計不同子區域內任務分布的數量及任務定價均值。如下表所示。
表1.2 任務數量與任務定價均值統計表
為更好的了解任務分布情況與任務定價間的對應關係,同時消除不同數量間維度的影響,我們將任務分布數量轉換為任務密度,研究任務密度與任務定價間的關係。如圖1.5所示,將任務定價標準化處理後調用Matlab cftool工具箱,擬合任務分布密度與任務定價歸一化數據間的函數關係。