Projects.
Ideas turned into reality.
数据分析与可视化

DataVista Hub 是面向企业打造的一体化数据驱动引擎,集数据采集、治理、分析、可视化与预测于一体,构建统一数据底座,支撑智能决策全流程。平台融合机器学习引擎、灵活数据接入与企业级安全体系,广泛应用于报表自动化、趋势预测、业务分析等场景,是企业推进数字化转型的核心中枢。
- 个人
- 完结

该项目以制造企业(模具制造/汽车排气管)为背景,聚焦 CNC/PLC 设备数据上报、扫码报工与远程监控三大核心场景。项目基于树莓派/EMQX 网关采集设备运行状态,通过 MQTT 协议实现边云联动,并同步写入 InfluxDB 等时序数据库。前端支持扫码枪快速工序录入,后端基于 FastAPI 构建数据服务,最终通过 Grafana / DataEase 打造工厂设备监控与生产报工可视化大屏,实现从底层设备到管理决策的一体化数字化转型平台。
- 个人
- 完结

基于 FineReport、FineBI 打造的汽车制造业可视化大屏,整合MySQL数据库中的生产线、质量和供应链数据,通过Spring Boot构建的数据接口实现多维度交互式分析,展示生产实况、产能和质量指标
- 个人
- 完结

融合Prometheus、Grafana、Loki、Tempo等监控组件,打造面向Hadoop/Spark/Flink等大数据组件的可观测性平台。通过自定义Exporter和OpenTelemetry,采集系统指标、服务链路与日志,实现多维告警、故障追踪和容量分析,为大数据平台提供一站式SRE保障方案。
- 个人
- 完结

本报告基于 Scrapy 框架,采集 BoXX直聘、汽车X家、企X查、小X课堂及微信小程序接口的多源数据,并对抓取结果进行数据清洗、统计分析与可视化展示。实现对结构化与半结构化数据的高效采集与持久化存储至 MySQL。报告呈现关键指标、趋势图表及数据洞察,为业务决策提供支持。
- 个人
- 进行中
数据仓库与集成平台

基于YARN资源调度的大数据集群环境,包含Hadoop HDFS分布式存储、Spark on YARN离线计算、Flink on YARN实时计算等组件的部署与管理,提供统一的 资源调度和分布式计算能力
- 个人
- 完结

基于Flink CDC实现业务数据实时采集,结合Spark+Hive构建离线数据仓库。采用Spark Streaming进行实时计算,打造统一的数据处理平台,实现实时和离线数据的一体化处理能力。
- 个人
- 完结

企业级大数据处理平台,集成 Hadoop、Hive、Presto、Spark、DataX 等,SpringBoot 统一服务调度,React 前端展示,支持任务调度、SQL 查询、HDFS 管理、Ranger 权限与多源异构整合。
- 个人
- 完结

企业级大数据平台项目,整合自动化部署、元数据管理、统一查询引擎及平台监控治理等核心能力。项目基于 Java(Spring Boot、MyBatis、gRPC)构建,同时辅以 Python 数据处理示例,支持 Hadoop、Hive、Spark、Presto 等大数据技术,实现数据的高效存储、处理与管理。
- 个人
- 未开始
