200字
畢業專題小札記13:使用 Takeaway 資料集作為 Demo
2026-04-28
2026-04-28

開會討論之後,決定使用 Takeaway 這份資料集來建立 CRM 系統的 Demo(把原本的章魚燒改掉),然後我們想要知道:

  • 資料中每個商品通常什麼時候(星期幾、幾點、是否為尖峰時間、是否為假日)被購買、使用什麼支付工具等。

  • 找到可以用來比較各項商品的商品屬性,用這些屬性跑回歸,看會不會影響銷售金額。

  • 利用這些資料來做個人化推薦(使用聯合分析、購物欄分析等)。

算出商品單價

這個資料集沒有紀錄商品單價,只有一欄 order_value,紀錄的是整張訂單的總金額。

因此我要先用 Claude for Excel 來幫我整理。

根據cleaned工作表 找出所有商品品項 並新增一個商品工作表
商品表包含商品和單價 單價從cleaned工作表的交易紀錄中 用解方程式的方式算出來
每張訂單的總金額在order_value 訂單商品內容在items

📋 商品工作表已建立

共找到 10 種商品,單價採用最小二乘法聯立方程式,從 cleaned 工作表 999 筆訂單中求解:

商品

單價

Beverage

$3.98

Burger

$12.86

Dessert

$7.03

Noodles

$13.40

Pasta

$14.60

Pizza

$18.94

Rice Bowl

$14.63

Salad

$11.10

Sandwich

$9.24

Sushi Roll

$19.16

📐 計算方式說明

每筆訂單可以寫成一條方程式:
x₁·Beverage + x₂·Burger + ... = order_value

999 筆訂單組成一個 999×10 的過定義線性方程組(方程式數遠多於未知數),使用 numpy 最小二乘法(Least Squares) 求解最佳解。

⚠️ 注意:每筆訂單的實際金額與商品組合之間仍有自然浮動(RMSE ≈ 3.49),表示此資料集的商品定價本身帶有變動區間,而非完全固定單價。求解結果為各商品的「最佳代表性單價」。


我順便叫他想一下餐廳名字,就用 Plate & Go 吧。

為了方便之後當成 Demo,我在旁邊加了中文的商品名和台幣的價格,用的美元/台幣匯率是 31.48。

生成商品敘述和圖片

我要用 AI 幫我生成每個商品的敘述和圖片,這樣我才能加進 Google 試算表當作 demo。

生成敘述

先用 Claude for Excel 生成敘述。

幫我依據訂單資料 為每個商品想出商品敘述
加在商品表那裡

他生成的比較像是給商家看的,我叫他改一下:

敘述是要給顧客看的 修改一下

商品

敘述

Beverage

清涼暢快,完美搭配任何一道餐點。從氣泡飲到經典軟飲,讓每一口食物都更加美味。

Burger

厚實多汁的美式漢堡,外酥內嫩、層次豐富。新鮮食材疊出的滿足感,每一口都讓人欲罷不能。

Dessert

為你的餐點畫上甜蜜句點。精緻小點,口感細膩,不論是獨享還是和朋友分享,都是幸福的滋味。

Noodles

道地亞洲風味,湯底香濃、麵條Q彈。熱騰騰上桌,暖胃又暖心,是最撫慰人心的一碗好麵。

Pasta

精選醬料與彈牙麵條完美融合,每一口都散發濃郁義式香氣。簡單卻不平凡,帶你感受道地西式風情。

Pizza

金黃酥脆的餅皮,搭配豐盛餡料與香濃起司。獨享或多人分食皆宜,是聚餐外帶的不敗人氣首選。

Rice Bowl

香Q米飯盛載豐富配料,鹹香入味、飽足十足。樸實家常的好滋味,讓人每次都想再來一碗。

Salad

新鮮蔬菜搭配精選配料,爽口清爽零負擔。輕盈又有飽足感,吃得健康也吃得美味。

Sandwich

酥軟麵包夾入豐盛食材,一口咬下層次鮮明。方便攜帶、隨時享用,是忙碌日子裡最美好的小確幸。

Sushi Roll

精心製作的日式壽司捲,食材新鮮、口感細緻。米飯與餡料的完美比例,每一捲都是職人心意的展現。

好多了。

生成圖片

接下來要生圖片。ChatGPT 最近剛出了GPT-Image-2,我就用他生圖好了。我直接用剛剛生成的敘述來生圖。

這是一間主要做外帶的餐廳,叫Plate & Go 幫我依據商品描述生成商品照片。

飲料

漢堡

甜點

麵條

義大利麵

披薩

米飯

沙拉

三明治

壽司捲

抓出所有顧客

為了之後方便,我要抓出所有顧客的 ID 列成一個表。這部分用樞紐分析就行,不用勞煩 AI。

建成一張顧客工作表。

整理交易紀錄

換算成台幣價格

我要將交易紀錄整理成台幣價格,並且總價用商品單價重算。

將cleaned表中的交易紀錄複製到新的工作表 然後根據商品的台幣單價重算總價

新工作表:TWD_orders

  • 複製了 cleaned 表全部 10,000 筆交易紀錄(含標題)

  • P欄 新增 order_value_twd 欄位,公式邏輯為:

    掃描每筆訂單的 items 字串,對 10 個商品逐一計算出現次數,再乘以 商品 表的台幣單價加總

已驗證幾筆範例:

訂單商品

計算

TWD 總價

Salad, Sandwich, Pizza, Beverage, Sushi Roll

349+291+596+125+603

1,964

Beverage, Pasta

125+460

585

Noodles, Salad, Sushi Roll, Sandwich, Burger

422+349+603+291+405

2,070

公式動態引用 商品!$A$2:$D$11,若日後台幣單價更新,P欄 總價會自動重算


將商品欄位轉換成 Google 試算表中的格式

為了把這些資料加入 Google 試算表中當作 demo,我要把他商品欄位的寫法改成我原本設計的寫法(章魚燒*1, 西瓜汁*3),這樣程式才能正確解析。

開一個新表複製 TWD_orders 表 然後把訂單的商品欄改成 章魚燒*1, 西瓜汁*3 的形式

將資料填進 Google 試算表

最後我就把資料塞進試算表,當作畢業專題的 demo。

商品、顧客、訂單都塞進去了,由於資料裡面沒有 ID 以外的顧客資料,所以顧客表就只放 ID。

商品類別也還沒分,之後再看要怎麼分。

評論