機器學(xué)習(xí)、人工智能和數(shù)據(jù)科學(xué)領(lǐng)域面臨的挑戰(zhàn)數(shù)量和復(fù)雜程度正在顯著增加。我們無法控制問題,但可以提高解決問題的能力,以找到合適的解決方案。如果您正在尋找創(chuàng)新的解決問題方法將業(yè)務(wù)問題轉(zhuǎn)化為數(shù)據(jù)科學(xué)問題,那么數(shù)學(xué)建模就是答案。
但是,我們真的能把每個業(yè)務(wù)問題都轉(zhuǎn)化為數(shù)據(jù)科學(xué)問題嗎?數(shù)學(xué)建模是戰(zhàn)略工具,它可以將任何業(yè)務(wù)問題轉(zhuǎn)化為數(shù)據(jù)科學(xué)問題,以找到有效的解決方案。它突出了所有要不惜一切代價避免的錯誤,以消除所有可能導(dǎo)致代價高昂的錯誤或浪費資源、時間和精力的情況。
一、理解數(shù)學(xué)建模
為了將這個概念分解為更簡單的術(shù)語,數(shù)學(xué)建??梢员环Q為使用基本算術(shù)、數(shù)學(xué)公式和方法來表示和解釋真實的業(yè)務(wù)問題和概念。
在將業(yè)務(wù)問題轉(zhuǎn)化為數(shù)據(jù)科學(xué)問題時,數(shù)學(xué)建模是一系列方程和不等式,可用作決策工具。然后,使用代數(shù)和算術(shù)定律來建立模型并求解。舉個例子:
我們來考慮一個簡單的盈利和虧損的情況:
收入—支出=利潤(若為負則為虧損)
這個等式解釋了利潤和虧損的定義:利潤是收入超過支出的數(shù)額,虧損是支出超過收入的數(shù)額。上面的等式解釋了模型中的關(guān)系?;谶@個數(shù)學(xué)模型,算術(shù)定律可以幫助推導(dǎo)出其他關(guān)系:
收入=利潤(若為負則為虧損)+費用
費用=收入—利潤(若為負則為虧損)
這只是一個簡單的例子,用來解釋如何使用基本算法將業(yè)務(wù)問題轉(zhuǎn)化為數(shù)學(xué)建模。然而,當(dāng)通過數(shù)學(xué)建模將業(yè)務(wù)問題轉(zhuǎn)化為數(shù)據(jù)科學(xué)問題時,需要根據(jù)目標(biāo)函數(shù)或目的使用高等數(shù)學(xué)。
例如,泰勒多項式可用于近似值。因此,企業(yè)正在分析客戶隨時間變化的消費模式。在這種情況下,泰勒多項式可以根據(jù)歷史數(shù)據(jù)近似消費趨勢,并且該模型可用于預(yù)測未來行為。因此,泰勒多項式非常適合通過數(shù)學(xué)建模解決業(yè)務(wù)問題。
另一個例子是使用馬爾可夫鏈預(yù)測未來。馬爾可夫鏈可用于對系統(tǒng)轉(zhuǎn)換、客戶行為、庫存管理和財務(wù)建模進行建模。
二、為什么在數(shù)據(jù)科學(xué)或機器學(xué)習(xí)中使用數(shù)學(xué)建模
數(shù)學(xué)建模是人工智能和數(shù)據(jù)科學(xué)從業(yè)者可以用來提取有價值的見解、優(yōu)化復(fù)雜系統(tǒng)和預(yù)測未來趨勢的實用技術(shù)之一。以下是數(shù)學(xué)建模如何通過將業(yè)務(wù)問題轉(zhuǎn)化為數(shù)據(jù)科學(xué)問題來幫助解決業(yè)務(wù)問題:
●有助于制定機器學(xué)習(xí)和數(shù)據(jù)科學(xué)算法
機器學(xué)習(xí)和數(shù)據(jù)科學(xué)算法的設(shè)計和開發(fā)依賴于數(shù)學(xué)原理。算法是旨在解決特定問題的數(shù)學(xué)構(gòu)造。
●協(xié)助建立變量之間的關(guān)系
數(shù)學(xué)模型表示和建立變量之間的關(guān)系,理解這種關(guān)系有助于建立準(zhǔn)確的模型。
●創(chuàng)建系統(tǒng)的方法從大量數(shù)據(jù)中尋找見解
它提供了一種系統(tǒng)的方法來捕捉數(shù)據(jù)之間的模式和關(guān)系,以幫助模型對新的、看不見的數(shù)據(jù)做出準(zhǔn)確的預(yù)測。
●簡化了優(yōu)化目標(biāo)函數(shù)的方法
它可以幫助優(yōu)化機器學(xué)習(xí)和數(shù)據(jù)科學(xué)算法并找到最小化或最大化特定目標(biāo)函數(shù)的最佳解決方案。
●提供一個框架來理解算法的可擴展性
當(dāng)數(shù)據(jù)集大小或數(shù)據(jù)科學(xué)問題的復(fù)雜性增加時,數(shù)學(xué)模型可以提供一個框架來理解算法的可擴展性及其性能。
三 、如何將實際的業(yè)務(wù)問題轉(zhuǎn)化為數(shù)據(jù)科學(xué)問題
以下是將業(yè)務(wù)問題轉(zhuǎn)化為數(shù)據(jù)科學(xué)問題的一些簡單步驟:
理解并定義問題
將業(yè)務(wù)問題轉(zhuǎn)化為數(shù)據(jù)科學(xué)問題的第一步是將模糊的實際業(yè)務(wù)問題框架化為具體問題。數(shù)據(jù)科學(xué)家面臨模糊的業(yè)務(wù)問題,例如增加收入或降低客戶流失率。然而,必須框架化問題并以某種方式定義它,以便可以使用數(shù)學(xué)建模來解決它。
以下是理解業(yè)務(wù)問題并將其轉(zhuǎn)化為具體數(shù)據(jù)科學(xué)問題的三種方法:
●向利益相關(guān)者提出切實的問題。
●優(yōu)先考慮痛點。
●從利益相關(guān)者那里獲得平衡的觀點。
例如,利益相關(guān)者可能想了解為什么用戶訪問網(wǎng)站但不購買任何東西。真正的問題在于提供不恰當(dāng)?shù)耐扑]。如果推薦不符合用戶的興趣,他們就不會與品牌互動,如果這樣做,客戶就會購買產(chǎn)品。
定義問題之后,像數(shù)據(jù)科學(xué)問題一樣思考解決問題的決策是至關(guān)重要的。哪些用戶會在90天內(nèi)流失,或者應(yīng)該提供哪些折扣來幫助他們返回并完成購買?
獲得答案的最佳方式是考慮時間,例如何時向用戶展示特定廣告以獲得最大轉(zhuǎn)化。
如果我們將其應(yīng)用到我們的示例中,定義的業(yè)務(wù)問題就變成:
應(yīng)該給哪些用戶折扣以避免在90天內(nèi)流失?
(1)制定分析目標(biāo)并確定解決方案的范圍
現(xiàn)在,我們已經(jīng)將業(yè)務(wù)問題轉(zhuǎn)化為數(shù)據(jù)科學(xué)問題,但進一步分解以進行實際分析至關(guān)重要。提出問題有助于引導(dǎo)您實現(xiàn)目標(biāo)。例如,
我們?nèi)绾螌崟r識別潛在的欺詐交易?
我們?nèi)绾晤A(yù)測哪些員工可能在未來六個月內(nèi)離開公司?
我們?nèi)绾螌⒖蛻舴殖刹煌娜后w以開展有針對性的營銷活動?
設(shè)定里程碑后,設(shè)計最小可行產(chǎn)品至關(guān)重要。最小可行產(chǎn)品將以較小的增量為利益相關(guān)者提供價值。任何數(shù)據(jù)科學(xué)項目都應(yīng)計劃在項目時間表內(nèi)為客戶提供增量價值。最小可行產(chǎn)品可以是分析報告、交互式Web應(yīng)用程序或分析儀表板的形式。
確定目標(biāo)指標(biāo)對于解決數(shù)據(jù)科學(xué)問題至關(guān)重要,因為這是利益相關(guān)者的期望結(jié)果。在確定目標(biāo)指標(biāo)時,請確保該指標(biāo)是可衡量的。此外,作為分析,所有指標(biāo)的子集不應(yīng)只有一組指標(biāo)。使指標(biāo)非技術(shù)性,以便所有利益相關(guān)者都可以輕松理解和領(lǐng)悟它。
(2)規(guī)劃數(shù)據(jù)集和分析
將業(yè)務(wù)問題轉(zhuǎn)化為數(shù)據(jù)科學(xué)問題的最后一步是規(guī)劃數(shù)據(jù)集,因為數(shù)據(jù)對于解決任何數(shù)據(jù)科學(xué)問題都至關(guān)重要。確定可用于解決問題的相關(guān)數(shù)據(jù)源,如財務(wù)記錄、客戶反饋等。預(yù)處理數(shù)據(jù)并將其轉(zhuǎn)換為適合數(shù)學(xué)建模的格式?,F(xiàn)在,通過首先消除不合適的技術(shù)來找到適合您的分析的方法,然后選擇流程,同時牢記約束。
四 數(shù)學(xué)建模在哪里發(fā)揮作用
將業(yè)務(wù)問題轉(zhuǎn)化為數(shù)據(jù)科學(xué)問題需要確定使用數(shù)據(jù)和分析解決問題的關(guān)鍵方面。這就是數(shù)學(xué)建模發(fā)揮作用的地方。它是轉(zhuǎn)換過程的關(guān)鍵組成部分,因為它提供了一個正式的框架來表示關(guān)系、進行預(yù)測和優(yōu)化解決方案。
讓我們了解實現(xiàn)數(shù)學(xué)建模以將業(yè)務(wù)問題轉(zhuǎn)化為數(shù)據(jù)科學(xué)問題的步驟:
定義問題—第一步是明確定義您要解決的業(yè)務(wù)問題陳述。例如,假設(shè)一家制造公司面臨著優(yōu)化其生產(chǎn)資源分配以最大化利潤同時最小化成本的挑戰(zhàn)。
做出假設(shè)——現(xiàn)在,數(shù)學(xué)模型通常需要簡化和假設(shè),以使問題更易于管理。因此,收集質(zhì)量數(shù)據(jù)并使用歷史數(shù)據(jù)或機器學(xué)習(xí)技術(shù)估算不確定參數(shù)。在我們的案例中,制造公司的專業(yè)人員將假設(shè)生產(chǎn)以恒定的速度進行,市場需求穩(wěn)定,并且資源成本在一段時間內(nèi)保持不變。
定義要在模型中使用的變量。下一步是確定影響實際業(yè)務(wù)問題的關(guān)鍵變量。在我們的案例中,影響我們問題的變量將是生產(chǎn)率、原材料成本、勞動力成本和生產(chǎn)時間。
計算解決方案—下一步是開發(fā)一個表示變量之間關(guān)系的數(shù)學(xué)方程。然后,利用數(shù)學(xué)技術(shù)(如優(yōu)化算法)來最小化或最大化目標(biāo)函數(shù)。在我們的示例中,數(shù)學(xué)方程將表示總成本作為生產(chǎn)率和資源成本的函數(shù)??偝杀緦⑹悄繕?biāo)函數(shù)。
評估和分析模型及其結(jié)果以驗證其準(zhǔn)確性。此步驟對于通過與歷史數(shù)據(jù)或運行模擬進行比較來評估模型的有效性和可靠性至關(guān)重要。
五 通過數(shù)學(xué)建模解決業(yè)務(wù)問題時應(yīng)考慮哪些參數(shù)
在將業(yè)務(wù)問題轉(zhuǎn)化為數(shù)據(jù)科學(xué)問題并通過數(shù)學(xué)建模解決時,需要考慮兩個組成部分,即變量和系數(shù)。
變量是數(shù)學(xué)模型中可以操縱的量。它有兩種類型:獨立變量或輸入變量和相關(guān)變量或輸出變量。
輸入或獨立變量—輸入變量是影響被建模系統(tǒng)的量。這些變量可以被操縱以獲得所需的結(jié)果。
輸出或因變量—輸出變量是感興趣的量。它們?nèi)Q于獨立變量。通常需要確定的是結(jié)果或目標(biāo)函數(shù)。
讓我們通過一個簡單的例子來理解這個概念:
在制造優(yōu)化模型中,因變量或目標(biāo)函數(shù)是降低總生產(chǎn)成本、最大化生產(chǎn)產(chǎn)量,有時甚至是兩者兼而有之。獨立變量是生產(chǎn)率、原材料成本、勞動力成本和生產(chǎn)時間。所有獨立變量都會影響因變量。
系數(shù)是代表固定值并定義變量之間關(guān)系的常數(shù)。因此,系數(shù)的值在模型內(nèi)不會改變。系數(shù)會影響您正在處理的模型或系統(tǒng)的行為。
目的是在考慮各種約束和目標(biāo)的同時,找到最大化整體目標(biāo)函數(shù)的參數(shù)值組合。
如何識別實際業(yè)務(wù)問題中的參數(shù)?
以下是通過數(shù)學(xué)建模解決業(yè)務(wù)問題時識別因素的一些方法:
●確定問題的關(guān)鍵要素。
徹底了解問題并確定在系統(tǒng)中發(fā)揮關(guān)鍵作用的關(guān)鍵要素和變量。例如,如果您優(yōu)化供應(yīng)鏈,潛在參數(shù)將是生產(chǎn)率、運輸成本和庫存水平。
●分析過去數(shù)據(jù)的參數(shù)。
利用歷史數(shù)據(jù)分析模式和趨勢。例如,在財務(wù)建模中,收入、支出、利率和市場條件等參數(shù)是可能對系統(tǒng)產(chǎn)生重大影響的一些變量。
●進行敏感性分析。
執(zhí)行敏感性分析,其中特定參數(shù)的變化可以幫助評估整個模型的影響。
●咨詢業(yè)務(wù)利益相關(guān)者。
您可以咨詢利益相關(guān)者或進行研究以確定實際業(yè)務(wù)問題中可能影響您的系統(tǒng)的標(biāo)準(zhǔn)參數(shù)。
如何建立參數(shù)之間的關(guān)系?
將業(yè)務(wù)問題轉(zhuǎn)換為數(shù)據(jù)科學(xué)問題并通過數(shù)學(xué)建模解決時,最困難的部分是找到參數(shù)之間的關(guān)系。找到目標(biāo)函數(shù)(因變量)和獨立變量后,您將需要數(shù)學(xué)函數(shù)來查看獨立變量如何導(dǎo)致輸出最大化。它需要頭腦風(fēng)暴會議來開發(fā)最佳解決方案以實現(xiàn)所需的輸出。
在將業(yè)務(wù)問題轉(zhuǎn)化為數(shù)據(jù)科學(xué)或機器學(xué)習(xí)問題時,以下一些數(shù)學(xué)工具可以幫助建立參數(shù)之間的關(guān)系:
●線性代數(shù)——使用線性回歸根據(jù)廣告趨勢預(yù)測銷售額。
●微積分——使用基于微積分的優(yōu)化方法找到最優(yōu)價格,從而實現(xiàn)利潤最大化。
●微分方程——通過使用微分方程對市場動態(tài)進行建模來預(yù)測未來的股票價格。
●概率與統(tǒng)計——分析客戶滿意度調(diào)查結(jié)果以推斷整個基礎(chǔ)。
●圖論——分析社交網(wǎng)絡(luò)以找出最有影響力的個人和團體。
小結(jié)
數(shù)據(jù)科學(xué)是一種有效的工具,可幫助企業(yè)了解其問題并準(zhǔn)確分析需要做什么才能實現(xiàn)目標(biāo)。數(shù)學(xué)建模是將業(yè)務(wù)問題轉(zhuǎn)化為數(shù)據(jù)科學(xué)問題的基礎(chǔ)。它提供了一個框架來表示關(guān)系、進行預(yù)測和優(yōu)化解決方案。
透明的溝通以及問題和目標(biāo)的定義應(yīng)該清晰,以確保數(shù)學(xué)模型能夠正確反映業(yè)務(wù)動態(tài)。此外,迭代和改進也是該過程必不可少的部分,因為如果業(yè)務(wù)需要發(fā)展,數(shù)學(xué)模型可能無法提供適當(dāng)?shù)男阅堋?/p>
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。