開會討論之後,決定使用 Takeaway 這份資料集來建立 CRM 系統的 Demo(把原本的章魚燒改掉),然後我們想要知道:
資料中每個商品通常什麼時候(星期幾、幾點、是否為尖峰時間、是否為假日)被購買、使用什麼支付工具等。
找到可以用來比較各項商品的商品屬性,用這些屬性跑回歸,看會不會影響銷售金額。
利用這些資料來做個人化推薦(使用聯合分析、購物欄分析等)。
算出商品單價
這個資料集沒有紀錄商品單價,只有一欄 order_value,紀錄的是整張訂單的總金額。
因此我要先用 Claude for Excel 來幫我整理。
根據cleaned工作表 找出所有商品品項 並新增一個商品工作表
商品表包含商品和單價 單價從cleaned工作表的交易紀錄中 用解方程式的方式算出來
每張訂單的總金額在order_value 訂單商品內容在items📋 商品工作表已建立
共找到 10 種商品,單價採用最小二乘法聯立方程式,從 cleaned 工作表 999 筆訂單中求解:
📐 計算方式說明
每筆訂單可以寫成一條方程式:x₁·Beverage + x₂·Burger + ... = order_value
999 筆訂單組成一個 999×10 的過定義線性方程組(方程式數遠多於未知數),使用 numpy 最小二乘法(Least Squares) 求解最佳解。
⚠️ 注意:每筆訂單的實際金額與商品組合之間仍有自然浮動(RMSE ≈ 3.49),表示此資料集的商品定價本身帶有變動區間,而非完全固定單價。求解結果為各商品的「最佳代表性單價」。

我順便叫他想一下餐廳名字,就用 Plate & Go 吧。

為了方便之後當成 Demo,我在旁邊加了中文的商品名和台幣的價格,用的美元/台幣匯率是 31.48。
生成商品敘述和圖片
我要用 AI 幫我生成每個商品的敘述和圖片,這樣我才能加進 Google 試算表當作 demo。
生成敘述
先用 Claude for Excel 生成敘述。
幫我依據訂單資料 為每個商品想出商品敘述
加在商品表那裡
他生成的比較像是給商家看的,我叫他改一下:
敘述是要給顧客看的 修改一下
好多了。
生成圖片
接下來要生圖片。ChatGPT 最近剛出了GPT-Image-2,我就用他生圖好了。我直接用剛剛生成的敘述來生圖。
這是一間主要做外帶的餐廳,叫Plate & Go 幫我依據商品描述生成商品照片。飲料

漢堡

甜點

麵條

義大利麵

披薩

米飯

沙拉

三明治

壽司捲

抓出所有顧客
為了之後方便,我要抓出所有顧客的 ID 列成一個表。這部分用樞紐分析就行,不用勞煩 AI。

建成一張顧客工作表。

整理交易紀錄
換算成台幣價格
我要將交易紀錄整理成台幣價格,並且總價用商品單價重算。
將cleaned表中的交易紀錄複製到新的工作表 然後根據商品的台幣單價重算總價新工作表:TWD_orders
複製了
cleaned表全部 10,000 筆交易紀錄(含標題)在 P欄 新增
order_value_twd欄位,公式邏輯為:掃描每筆訂單的
items字串,對 10 個商品逐一計算出現次數,再乘以商品表的台幣單價加總
已驗證幾筆範例:
公式動態引用 商品!$A$2:$D$11,若日後台幣單價更新,P欄 總價會自動重算。

將商品欄位轉換成 Google 試算表中的格式
為了把這些資料加入 Google 試算表中當作 demo,我要把他商品欄位的寫法改成我原本設計的寫法(章魚燒*1, 西瓜汁*3),這樣程式才能正確解析。
開一個新表複製 TWD_orders 表 然後把訂單的商品欄改成 章魚燒*1, 西瓜汁*3 的形式
將資料填進 Google 試算表
最後我就把資料塞進試算表,當作畢業專題的 demo。



商品、顧客、訂單都塞進去了,由於資料裡面沒有 ID 以外的顧客資料,所以顧客表就只放 ID。
商品類別也還沒分,之後再看要怎麼分。