Hello, Damon!

杨新龙

10+年经验 大数据架构 LLM / RAG / Agent Spark · Flink · Ray 苏州
SCROLL

关于

拥有 10 余年大数据与 AI 工程经验,从 Java 后端开发起步,逐步深耕大数据平台建设、数据挖掘与 AI 应用落地。

先后就职于 Tesla智慧芽等知名企业,主导搭建多个从 0 到 1 的核心平台:非结构化数据处理中台、多模态搜索平台、企业级 AI PaaS 平台。

在 LLM 领域有丰富的工程实践:模型部署、量化、微调、推理加速,以及基于 LLM 构建 Agent、RAG 等应用,使用蒸馏方式微调意图识别、领域 Embedding 等小模型。

热衷于学习 GitHub 优秀项目源码,将前沿技术快速落地为业务价值。

0年
工作经验
0家
就职公司
0+
核心项目

专业技能

🔥
大数据生态
Spark / Spark SQL95%
Flink / Flink SQL88%
Hadoop / Hive / HDFS90%
Airflow / Presto / Hudi85%
🤖
Agent / LLM
LLM 部署 / 量化 / 微调92%
RAG / GraphRAG / Agent90%
Ray / Daft 分布式计算85%
Langchain / LangGraph88%
💻
编程语言
Python93%
Java90%
Scala75%
SQL95%
🗄️
数据库 & 存储
MySQL / PostgreSQL92%
ClickHouse85%
Redis / MongoDB88%
S3 / Delta Lake82%

工作经历

2024.06 — 至今
智慧芽信息科技(苏州)有限公司
资深大数据开发工程师
搭建非结构化处理平台,建立基于 YAML 的数据开发范式,搭建 AI 智数平台,集成 Skills、MCP,构建数据内部自动化数据 pipeline 的智能平台。
2022.01 — 2024.06
Tesla
IT Application Sr. Data Engineer
销售/金融/运营报表数据的离线、实时开发;CDP 客户发展平台;多模态搜索平台;LLM 本地部署及推理加速;模型微调优化。
2020.04 — 2022.01
江苏云学堂网络科技有限公司
高级大数据开发挖掘工程师
从 0 开始搭建阿里云大数据生态;构建用户画像;基于推荐算法实现课程推荐;搭建数据资产平台及数据治理平台。
2018.01 — 2020.04
苏州工业园区心血管健康研究院
技术经理
管理技术团队,完成医院胸痛中心、心衰中心等认证工作;从 0 搭建 Hadoop 生态基座、大数据可视化平台、质控平台。
2014.06 — 2017.12
苏州人尊信息技术有限公司
Java 后端开发 → 技术经理
在创业公司由 Java 开发一步步发展到技术经理,带领 6 人团队进行 App、公众号、小程序的开发工作、技术创新及项目管理。

核心项目

🧠
2025.12—至今
智能数据平台(AI PaaS)
智慧芽信息科技
企业级 AI PaaS 平台,集 RAG 知识库、代码辅助 Agent 与智能数据分析于一体。统一 LLM 网关、Advanced RAG、知识蒸馏、全链路监控。
vLLM GraphRAG Ray OTel
查看详情 →
2024.12—至今
Hyperion 非结构化数据处理中台
智慧芽信息科技
从 0-1 完成平台设计及功能开发,支持文档、图片、音视频、网页等多种非结构化数据处理,实现 CICD 自动部署 k8s。
LangGraph Layout AI k8s CICD
查看详情 →
🔧
2024.6—2024.12
Pishon 任务调度编排系统
智慧芽信息科技
构建 YAML 任务编排范式��基于 CICD 自动构建 Airflow 任务,大大减少重复性开发工作,替代原来每次都需要 Java 开发并打包上传的流程。
Airflow YAML gitlab-ci
查看详情 →
🚗
2023.9—2024.6
TVS 智能中台
Tesla
多模态搜索平台结合 LLM,支持文搜图、文搜视频、图搜视频。本地部署 LLM,通过量化和推理加速实现 20 倍性能提升。
LLM 多模态 量化 Langchain
查看详情 →
📊
2022.9—2023.10
销售线索数据挖掘
Tesla
独立完成数据收集、预处理、特征转换、算法开发、模型训练、效果验证、BI 可视化开发全流程。通过模型进行线索分析及分级提效。
XGBoost 特征工程 联邦学习
查看详情 →
👥
2022.1—2023.6
CDP 客户发展管理平台
Tesla
用户画像、用户圈选、智能营销、用户全局 OneID 构建。已创建上千个标签,通过 Bitmap 实现快速用户圈选,Spark 图计算实现 OneID。
用户画像 Bitmap 图计算
查看详情 →
🎯
2021.1—2022.1
课程推荐系统
江苏云学堂
多路召回 + 重排两层推荐过滤,基于 Spark 实现 GBDT+LR 重排,通过 Flink 做实时短期兴趣推荐,解决长尾问题及冷启动问题。
GBDT+LR 协同过滤 Flink
查看详情 →
🏛️
2020.4—2021.10
数据资产治理和管理平台
江苏云学堂
数据质量管理、数据标准、统一规范、元数据管理。参考 Spark 源码对 SQL 解析方式,对所有 Spark、Hive、Flink 任务进行解析整理企业级数据资产。
元数据 SQL解析 数据治理
查看详情 →
🏥
2018.1—2020.4
胸痛中心数据质控平台
苏州心血管健康研究院
为全国各医院进行胸痛中心认证,搭建 Hadoop 大数据集群,通过机器学习模型填充缺失值,Spark 计算监控指标项。
Hadoop Sklearn 质控
查看详情 →
📱
2014.6—2017.12
和谁一起 — 本地社交电商
苏州人尊信息技术
本地活动和本地消费的社交电商平台,带领 6 人团队 3 个月上线 APP、小程序、公众号,优化秒杀架构,学习推荐算法优化商品曝光。
Java 秒杀 推荐算法
查看详情 →

教育经历

🎓
南京理工大学紫金学院
计算机科学与技术 · 本科
2010.09 — 2014.06  |  CET-4

联系

✉️
Email
chenblue1224@gmail.com
📱
Wechat
DamonYang9202
📍
Location
江苏 · 苏州