資料礦工小站

我挖!我挖!我哇!哇!哇!



Archive for February, 2009

轉貼:Visual Numerics – Developers of IMSL and PV-WAVE

Posted by admin on 23rd February 2009

資料來源:Visual Numerics

主題:威能信息的產品信息

PV-WAVE 產品家族:PV-WAVE、TS-WAVE 以及 JWAVE!

主要的運算 Function 來自 IMSL (International Mathematics and Statistics Library)

我們可以在 Wikipedia 找到更詳細的說明:Click Here!

Regards, 工頭 George

Posted in News | No Comments »

轉貼:危機下 BI 迎來新契機

Posted by admin on 22nd February 2009

資料來源:睿商在線 – 新聞中心

主題:危機下 BI 迎來新契機

人物:SAP 子公司 Business Objectives 中國區首席顧問 魯百年博士

2008 年的突破

  • 應用內容的增加
  • 行業應用的增加 (從電信、金融為主,擴大到其他行業)
  • 內容方面 “質” 的提昇 (從 75% 報表 + 20% 多維分析 + 5% 數據挖掘 到 “更多的數據分析”)
  • 由部門級的應用 (銷售、績效分析) 提昇到企業級的應用 (財務獲利分析、ERP、整體企業績效管理、等)

2009 年的熱點應用

  • G (公司治理)
  • R (風險管理)
  • C (合規?)

Said:

1. SI 公司的 Solution 主要還是落在平台與軟件上,訣竅在公司治理、風險管理的制度規劃與策略選擇,S/W 只是實現這些 concept 、 construct 與 Measure 的工具。
2. SI 公司為了協助客戶解決這些問題、either 是自己培養行業的顧問 or 將這部份高端的諮詢委外。
3. 隨著 BI 在業界的使用越來越普遍、簡易型的 BI Solution 將由企業自行解決。
4. 對外部的 consultant 而言,往高端走、專注於某些行業,應該是比較 OK 的發展與成長策略。

Regards, 工頭 George

Posted in News | 2 Comments »

Ranking – DataMining.Com.Tw

Posted by admin on 17th February 2009

資料內容:Datamining.com.tw – Traffic Details from Alexa

Yesterday 1 Wk. Avg. 3 Mos. Avg. 3 Mos. Change
N/A* 4,153,954 4,644,061 up! 18,730,551

透過 Alexa 追蹤 DataMining.Com.Tw 的 Ranking;
全世界來看,約莫落在 400 多萬左右 … 慢慢努力吧!

Regards, 工頭 George

Posted in Misc. | No Comments »

什麼是 “方法論” ?

Posted by admin on 11th February 2009

維基百科:笛卡兒 (René Descartes) 於 1637 年出版的哲學著作 (Discours de la méthode) 指出,研究問題的方法分四個步驟:

  1. 只要沒有經過自己切身體會的問題,不管有什麼權威的結論,都可以懷疑。就是著名的「懷疑一切」理論。
  2. 可以將要研究的複雜問題,盡量分解為多個比較簡單的小問題,一個一個地分開解決。
  3. 將這些小問題從簡單到複雜排列,先從容易解決的問題著手。
  4. 將所有問題解決後,再綜合起來檢驗,看是否完全,是否將問題徹底解決了。

方法論:研究 “研究方法” 的方法!

Data Mining 這個 Domain 的廠商都各自有提出所謂的方法論,其中 SPSS 的 CRISP-DM 算是 awareness 比較高的一個吧!其中 Clementine 的普及,應該有不小的功勞。

Regards, 工頭 George

Posted in CRISP-DM | No Comments »

轉貼:數據問題掣肘零售業 CIO 探討數據分析

Posted by admin on 10th February 2009

資料來源:IT 商業新聞網 – 信息化

主題:數據問題掣肘零售業 CIO 探討數據分析

文章先將 CIO 與 Analyst 的 責任 區隔為

  1. CIO 是要從戰略層面上規劃企業的商業智能架構、而
  2. Analyst 則是從邏輯層面上將 “數據分析主題” 推導出有實用價值的 Model 與算法

對於 CIO 的責任、值得關注的有兩項:

  • 數據倉庫平台的選擇
  • 商業智能項目的階段特徵 (導入前後角色的轉換)

對於 Analyst 的 Demo and/or Example:

  • 客戶價值矩陣分析
  • RFV 三維分類模型 (即 RFM 模型)
  • 客戶生命周期分析
  • 啤酒與尿布 (Basket Analysis)

Said:

首先想要討論的是 Analysis 這一塊 Outsourcing 的問題

  1. 從工具的 Distribution 趨勢看:隨著 BI 工具的功能越來越多,對參與分析人員的 Skill 要求將會越來越低,Entry Level 的分析將會類似 Office 套件般的日益普及。
  2. 從分析人員的培養與需求看:一般 Analyst 的培養在 3~5 間會是較成熟的程度,但很少能夠持續停留在純 Analyst 的 Career 上,不是離開企業成為獨立的 SOHO、就是轉為管理者的角色。
  3. 所以探討 CIO vs. Analyst 的責任,不若討論 Client vs. Agent 的關係。

至於 Analysis 的課題? Depends on 分析的目的 and 架構:

  • 跟 Acquisition 有關的分析:如何找到 “對” 的 Prospects,所以 Classification、Segmentation、Probability of Acquired、等 
  • 跟 Penetration 有關的分析:如何 “增加” Customer 的 Spending?所以需要 Basket Analysis、Probability of Cross Sell、RFM、SOW、等
  • 跟 Retention 有關的分析:Attrition Analysis、生命周期分析、Markov Chain Migration 分析、等
  • 跟 Efficiency 有關的分析:ROI Analysis、組合模型的最佳化、等

解決方案的設計還要看 Marketing Model 的假說 (Hypothesis),依 Hypothesis 解釋 Customer 的行為與需求!所以除了上面的一些 example 外,其實還有許多其他的 ideas 有待我們去 explore 的。

AND 其次;對 customer 需求的探索經常需要結合 Database 與 Research 的資料,所以這個時候,類似 Conjoint Analysis 與 Hierarchical Bayesian 這樣的 technology 就必須要考慮進來了。

Posted in Data Mining, News | No Comments »

轉貼:改善 Medicaid 紐約年省10億

Posted by admin on 8th February 2009

資料來源:世界日報

Data Mining 在 醫療、保險 的 Fraud 是相當普遍的應用,一般多是透過 outliers 的分析,找異常的狀況,或是透過 Predictive Model 找 Fraud 的 probability …

這個是 2007/12/27 quote 的文章,當時接 BLI 的項目,所以對這方面的資料也比較留意一些,總的來說,跟 Financial 相關的行業,對 Fraud 都相對比較重視,只是 Fraud 主要是在節流與防弊,對行銷來說,似乎開源會比較重要吧 ???

找時間再把這方面的 paper 整理一下 …

Regards, 工頭 George

Posted in News | No Comments »

轉貼:從營銷角度認識 CRM 與數據庫營銷體系

Posted by admin on 4th February 2009

資料來源:IT 商業新聞網

主題:從營銷角度認識 CRM 與數據庫營銷體系

Said:

1. 大陸 said “數據庫營銷”,這邊說 “資料庫行銷”、就是 “Database Marketing” 啦,並不是個新的 Term,只是這個 term 通常不像它的應用 (例如:CRM, Direct Marketing, Data Mining, etc.) 那樣被提及,但這些東西的核心其實是差異不大的。

2. 從 Business 的角度來看,能解決 Bottom Line 的才是正道理,不管是什麼 Term,要處理的就是 Customer Needs and/or Corporate Profitability … “We Sell, or Else!”

3. 個人覺得:在這個 Domain 要有些成就的話 (不談 SI 方面的發展),可能需要在 Database (SQL, Data Preparation, etc.)、Statistics (特別是多變量分析, HB, etc.)、以及 Domain Knowledge (行業知識) 等三個方面要有些經驗與能力才是。

Regards, 工頭 George

Posted in News | No Comments »

轉貼:向 Google 發戰書、微軟將發佈”群体搜索”

Posted by admin on 2nd February 2009

資料來源:技術開發 @ IT168

To be Followed, this February …

Regards, 工頭 George

Posted in News | No Comments »