// principle 01
先对齐口径,再聊结论。
复盘 GMV 异常之前,先核对维度、过滤条件、归因窗口。 90% 的数据撕逼来自口径错位,而不是模型错。
我叫 彭茜,应用统计在读硕士。在 快手电商、MIQ 程序化广告、 Bilibili 直播 之间打过工。 我习惯把 ETL、AB 实验、用户画像、爆品归因拆成可以解释的"为什么",再变成 可监控的仪表盘和能复用的决策备忘录。
// status
$ available_from = "2026-06"
$ focus = ["growth", "product_data", "AI_apps"]
$ location = "Shanghai / Beijing OK"▮
01 / Internships
03
02 / Dashboards shipped
08+
03 / Best campaign GMV lift
150%
04 / Years of SQL
3.0
01 / about
// principle 01
复盘 GMV 异常之前,先核对维度、过滤条件、归因窗口。 90% 的数据撕逼来自口径错位,而不是模型错。
// principle 02
看板不是用来交差的,是用来让小二第二天少踩一个坑。 每一个图表都附一行行动建议。
// principle 03
XGBoost 告诉我哪个标签权重高, 但是要不要把它真的投入营销策略,是人的判断。
02 / work · 实习经历
从 B 站直播间,到 MIQ 跨国广告投放,再到快手电商核心场。 每一段都让我对"数据如何驱动决策"的理解多了一层。
2026.01 — 2026.05
01
KUAISHOU E-COMMERCE · DATA & BI
// impact card
CAMPAIGN HEALTH 92/100
2025.08 — 2026.01
02
MIQ · PROGRAMMATIC · TTD / DV / GLOBAL
// ad-ops console
WEEKLY IMPRESSIONS
2025.03 — 2025.07
03
BILIBILI · LIVE COMMERCE · CATEGORY OPS
// live-room snapshot
SALES TREND · 12 WEEKS
03 / stack · 技能
百分比反映的是「我在真实项目里独立完成的把握度」,不是自封的水平。 每一条都能展开聊一个 case。
Hive / Spark SQL · 多维归因 · 长周期查询调优
pandas / numpy / sklearn · 高并发抓取与清洗脚本
从口径定义到大盘 / 异常监控看板
KMeans · XGBoost · 时间序列 · 智能风控方法
海量数据链路搭建 · DWM 层重构
短带 / 数字人直播 AB · CUPED 思路
Cursor / Trae / Cloudflare / GitHub demo 全链路
看板美化 · 项目页 · 物料设计
04 / labs · 项目
三个不同方向的 side project:用户画像建模、社交工具产品、跨境电商数据集。 共同特征是 — 都跑通了端到端的数据流。
LAB / 01 · USER MODELING
清洗 2 万条 抖音用户动态后台标签、搜索记录与商家商品信息, 可视化多维购买动态偏好;KMeans 处理特征标签;XGBoost 回归预测, 量化不同标签对消费转化的影响权重 — 从 0 到 1 构建一个基于机器学习的用户画像产品模型, 为商家提供精准营销与推荐策略。
model
XGBoost
cluster
KMeans · k=6
data
20K rows
// feature importance (top 5)
LAB / 02 · SOCIAL × FITNESS
— 社交 + 运动的趣味性工具
主导将海量非结构化业务数据结构化并接入 LLM, 设计与优化数据清洗逻辑与 Prompt 架构, 打通 数据接入 → AI 处理 → 云端部署 的全链路自动化流转。
step 01
RAW
step 02
LLM
step 03
CLOUD
→ 端到端自动化跑通
LAB / 03 · CROSS-BORDER DATA
— 出国旅行刚需信息聚合
运用 Python 编写 高并发自动化抓取与清洗 脚本, 搭建稳定的多源异构数据挖掘链路, 产出高质量海外护肤品、保健品结构化数据集, 支持原始数据自动化处理与特征模拟。
$ scraper --concurrency 32 --regions JP KR ID
$ pipeline --clean --dedupe --normalize
$ export > dataset.parquet
✔ 12,540 rows produced
LAB / 04 · IN PROGRESS
正在参与中。负责探索 AI 在业务场景中的落地 demo — 熟悉 Cursor / Cloudflare / Trae / GitHub 全套工作流, 独立完成高质量业务数据的构造与调优。
05 / edu
2025.09 — 2027.06
已修课程:统计模型 · 机器学习 · 时间序列分析 · 高级程序设计 · 高级数据库技术 · 智能风控方法与应用。
2021.09 — 2025.06
跨学科背景:让我除了懂数据,也懂"用数据的人"。
通用素质
熟悉 PS / Figma / Animate / 可画等设计工作;逻辑思维严密,对数据异常敏感, 具备快速学习新业务并抽象问题的能力。
let's build something
06 / contact · 联系
正在找 2026 暑期实习。 如果你的团队需要一个能从 ETL 一直管到 Dashboard 再到决策建议的人 — 我可能合适。 欢迎邮件 / 微信,简历有更多 case 可以聊。
// direct line