[ PQ_TERMINAL ] v25.06.05 Hire / 联系
// now broadcasting looking for / summer intern 2026

I turn
noisy data
into decisions .

我叫 彭茜,应用统计在读硕士。在 快手电商MIQ 程序化广告Bilibili 直播 之间打过工。 我习惯把 ETL、AB 实验、用户画像、爆品归因拆成可以解释的"为什么",再变成 可监控的仪表盘和能复用的决策备忘录。

// status

$ available_from = "2026-06"
$ focus = ["growth", "product_data", "AI_apps"]
$ location = "Shanghai / Beijing OK"

01 / Internships

03

02 / Dashboards shipped

08+

03 / Best campaign GMV lift

150%

04 / Years of SQL

3.0

SQL · Python · Tableau · Spark · Flink · Hive · XGBoost · KMeans · AB Test · Prompt Eng. · ETL · Dashboard · Growth · Causal Inference · SQL · Python · Tableau · Spark · Flink · Hive · XGBoost · KMeans · AB Test · Prompt Eng. · ETL · Dashboard · Growth · Causal Inference ·

01 / about

I read
spreadsheets
like novels.

// principle 01

先对齐口径,再聊结论。

复盘 GMV 异常之前,先核对维度、过滤条件、归因窗口。 90% 的数据撕逼来自口径错位,而不是模型错。

// principle 02

指标要能回答业务的"那现在怎么办"。

看板不是用来交差的,是用来让小二第二天少踩一个坑。 每一个图表都附一行行动建议。

// principle 03

AI 是放大器,不是答案本身。

XGBoost 告诉我哪个标签权重高, 但是要不要把它真的投入营销策略,是人的判断。

02 / work · 实习经历

Three rooms,
three data languages.

从 B 站直播间,到 MIQ 跨国广告投放,再到快手电商核心场。 每一段都让我对"数据如何驱动决策"的理解多了一层。

2026.01 — 2026.05

01

快手 · 电商行业运营实习

KUAISHOU E-COMMERCE · DATA & BI

  • 分析海量业务数据,完成 Showcase 挖掘并评估商家行为特征;制作报表筛选潜在商家进入激励对赌活动,跟进有效转化与流量奖励。
  • 协助设计并跟进 短带 / 数字人直播 的 AB Test,进行爆款数据拆解。
  • 基于多个电商核心指标匹配数据集口径,主导开发 春上新 / 38 大促 / 618 人设组 多个 BI Dashboard,使用 Tableau 完成同环比可视化。
  • 协助小二需求进行 DWM 层重构 等 ETL 处理,活动补贴促动大场实现盘播 150%+ GMV / 120%+ 商业化消耗,并日推商圈整体异常波动。

// impact card

GMV uplift+150%
AD spend+120%
Dashboards3 BI
AB tests★★★

CAMPAIGN HEALTH 92/100

2025.08 — 2026.01

02

MIQ 程序化广告 · 数据分析实习

MIQ · PROGRAMMATIC · TTD / DV / GLOBAL

  • 用 SQL 提取多维广告投放数据,优化 Excel 自动化报表模板(Vlookup / Pivot),输出日报 / 周报 / 月报,建立核心指标监控体系。
  • 独立负责异常值自动化查找与归因,运用分类、聚类方法追踪异常流量并解决投放问题。
  • Python 独立设计 ETL 数据流,完成多国(日韩、印尼等)海量广告投放数据的清洗、转换与入仓;针对长周期查询瓶颈,重构底层查询逻辑 / 优化表结构。
  • 主导构建跨时区、多板块异构数据源的全球投放监控看板。配合 Creative 上传、Social Boost、落地页对接,参与 网易钛动 · 燕云十六声 / 漫威 等海外角色上新推广。

// ad-ops console

regionimpctr
JP14.2M2.3%
KR9.8M1.9%
ID22.1M3.1%
VN11.5M2.7%

WEEKLY IMPRESSIONS

2025.03 — 2025.07

03

Bilibili · 电商直播运营实习

BILIBILI · LIVE COMMERCE · CATEGORY OPS

  • 建立竞品及品类数据库,借助企微 / 飞书构建在线监测看板,实时洞察竞品数据与价格波动,为业务团队提供预警与决策支持。
  • 进行品类销售预测,选择主推商品并制定销售方案(如 《灵笼》白月魁手办 等周边)。
  • 定期复盘销售数据并进行深度归因,对比现货 / 预售、历史库存;基于 SQL 提取多维度电商 / 直播数据,挖掘流量与产品侧的变现机会,提升整体 ROI。

// live-room snapshot

GMV▲ 38%
ROI▲ 1.7×
UV121K
CTR4.8%

SALES TREND · 12 WEEKS

03 / stack · 技能

Tools
I actually use,
not just list.

百分比反映的是「我在真实项目里独立完成的把握度」,不是自封的水平。 每一条都能展开聊一个 case。

SQL95%

Hive / Spark SQL · 多维归因 · 长周期查询调优

Python (Data + ETL)90%

pandas / numpy / sklearn · 高并发抓取与清洗脚本

Tableau / BI88%

从口径定义到大盘 / 异常监控看板

ML & Stats82%

KMeans · XGBoost · 时间序列 · 智能风控方法

Spark / Flink / Hive78%

海量数据链路搭建 · DWM 层重构

AB Test / 实验分析85%

短带 / 数字人直播 AB · CUPED 思路

LLM / Prompt Eng.80%

Cursor / Trae / Cloudflare / GitHub demo 全链路

Design (PS / Figma / Animate)75%

看板美化 · 项目页 · 物料设计

#UserProfiling #FunnelAnalysis #Attribution #RiskControl #ProgrammaticAds #LiveCommerce #CrossTimezone #PromptArchitecture #DataPipeline #CrossCulturalEN
PROJECTS · 项目 · CASE STUDIES · 我做过什么 · 不止是 PPT · WHAT I'VE SHIPPED · 现场可演示 · PROJECTS · 项目 · CASE STUDIES · 我做过什么 · 不止是 PPT · WHAT I'VE SHIPPED · 现场可演示 ·

04 / labs · 项目

Side projects,
very serious.

三个不同方向的 side project:用户画像建模、社交工具产品、跨境电商数据集。 共同特征是 — 都跑通了端到端的数据流。

LAB / 01 · USER MODELING

抖音用户消费行为
标签体系构建与预测

ML / Python

清洗 2 万条 抖音用户动态后台标签、搜索记录与商家商品信息, 可视化多维购买动态偏好;KMeans 处理特征标签;XGBoost 回归预测, 量化不同标签对消费转化的影响权重 — 从 0 到 1 构建一个基于机器学习的用户画像产品模型, 为商家提供精准营销与推荐策略。

model

XGBoost

cluster

KMeans · k=6

data

20K rows

// feature importance (top 5)

browse_freq
.88
cart_recency
.74
avg_price
.62
search_kw
.55
live_watch
.41

LAB / 02 · SOCIAL × FITNESS

Stamina Hunter Squad

— 社交 + 运动的趣味性工具

主导将海量非结构化业务数据结构化并接入 LLM, 设计与优化数据清洗逻辑与 Prompt 架构, 打通 数据接入 → AI 处理 → 云端部署 的全链路自动化流转。

step 01

RAW

step 02

LLM

step 03

CLOUD

→ 端到端自动化跑通

LAB / 03 · CROSS-BORDER DATA

K-Travel Hub

— 出国旅行刚需信息聚合

运用 Python 编写 高并发自动化抓取与清洗 脚本, 搭建稳定的多源异构数据挖掘链路, 产出高质量海外护肤品、保健品结构化数据集, 支持原始数据自动化处理与特征模拟。

$ scraper --concurrency 32 --regions JP KR ID

$ pipeline --clean --dedupe --normalize

$ export > dataset.parquet

✔ 12,540 rows produced

LAB / 04 · IN PROGRESS

字节跳动 AI 全栈挑战赛

正在参与中。负责探索 AI 在业务场景中的落地 demo — 熟悉 Cursor / Cloudflare / Trae / GitHub 全套工作流, 独立完成高质量业务数据的构造与调优。

LIVE / 进行中 · 更新会同步在这里

05 / edu

Where I
learned
the rules.

2025.09 — 2027.06

上海对外经贸大学 · 应用统计 (硕士)

已修课程:统计模型 · 机器学习 · 时间序列分析 · 高级程序设计 · 高级数据库技术 · 智能风控方法与应用。

2021.09 — 2025.06

上海师范大学 · 人力资源管理 (学士)

跨学科背景:让我除了懂数据,也懂"用数据的人"。

通用素质

CET-6 · 跨国英文协作 / 邮件沟通

熟悉 PS / Figma / Animate / 可画等设计工作;逻辑思维严密,对数据异常敏感, 具备快速学习新业务并抽象问题的能力。

let's build something

06 / contact · 联系

Got an
intern slot?
Let's talk.

正在找 2026 暑期实习。 如果你的团队需要一个能从 ETL 一直管到 Dashboard 再到决策建议的人 — 我可能合适。 欢迎邮件 / 微信,简历有更多 case 可以聊。

// direct line

➜ Send me an offer