常用提示词场景
舟率率 6/14/2025 promoto
# 根据表,判断出可以做出哪些方面的分析
以下几个表可以进行哪些方面的分析,只可以用表有的字段,不可以无中生有字段,不要延伸
DROP TABLE IF EXISTS cn_car_model_monthly_sales;
CREATE TABLE IF NOT EXISTS cn_car_model_monthly_sales (
yr INT COMMENT '年份',
mon TINYINT COMMENT '月份',
rk INT COMMENT '排名',
model VARCHAR(100) COMMENT '车型',
maker VARCHAR(100) COMMENT '厂商',
sales INT COMMENT '销量',
min_price DOUBLE COMMENT '最低价格',
max_price DOUBLE COMMENT '最高价格',
avg_price DOUBLE COMMENT '平均价格'
) ENGINE = InnoDB,
DEFAULT CHARSET = utf8mb4,
COLLATE = utf8mb4_unicode_ci,
COMMENT = '车型月度销量清洗表';
DROP TABLE IF EXISTS cn_car_manufacturer_monthly_sales;
CREATE TABLE IF NOT EXISTS cn_car_manufacturer_monthly_sales (
yr INT COMMENT '年份',
mon TINYINT COMMENT '月份',
rk INT COMMENT '排名',
logo VARCHAR(255) COMMENT '厂商logo',
maker VARCHAR(100) COMMENT '厂商名称',
sales INT COMMENT '销量',
share DOUBLE COMMENT '市场份额'
) ENGINE = InnoDB,
DEFAULT CHARSET = utf8mb4,
COLLATE = utf8mb4_unicode_ci,
COMMENT = '车企月度销量清洗表';
DROP TABLE IF EXISTS cn_car_total_sales;
CREATE TABLE IF NOT EXISTS cn_car_total_sales (
yr INT COMMENT '年份',
time_str VARCHAR(20) COMMENT '时间字符串',
sales INT COMMENT '总销量',
yoy DOUBLE COMMENT '同比增长率'
) ENGINE = InnoDB,
DEFAULT CHARSET = utf8mb4,
COLLATE = utf8mb4_unicode_ci,
COMMENT = '汽车总销量清洗表';
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
# 快速生成hive分析代码
【分析目标】
请帮我用hive sql对中国汽车销售数据进行分析,只能用表里有的字段,不要进行无中生有,不要延伸,每个分析均需将结果创建为新的Hive表,还要支持重复执行,避免存在重复数据,每完成一个分析,就要查询表中的10条数据进行结果展示
【表结构】
-- 车型月度销量表
DROP TABLE IF EXISTS cn_car_model_monthly_sales;
CREATE EXTERNAL TABLE IF NOT EXISTS cn_car_model_monthly_sales (
yr INT COMMENT '年份'
mon TINYINT COMMENT '月份'
rk INT COMMENT '排名'
model STRING COMMENT '车型'
maker STRING COMMENT '厂商'
sales INT COMMENT '销量'
min_price DOUBLE COMMENT '最低价格'
max_price DOUBLE COMMENT '最高价格'
avg_price DOUBLE COMMENT '平均价格'
)
COMMENT '车型月度销量清洗表'
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\001'
LINES TERMINATED BY '\n'
STORED AS TEXTFILE
LOCATION '/data/car/cn_car_model_monthly_sales';
-- 车企月度销量表
DROP TABLE IF EXISTS cn_car_manufacturer_monthly_sales;
CREATE EXTERNAL TABLE IF NOT EXISTS cn_car_manufacturer_monthly_sales (
yr INT COMMENT '年份'
mon TINYINT COMMENT '月份'
rk INT COMMENT '排名'
logo STRING COMMENT '厂商logo'
maker STRING COMMENT '厂商名称'
sales INT COMMENT '销量'
share DOUBLE COMMENT '市场份额'
)
COMMENT '车企月度销量清洗表'
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\001'
LINES TERMINATED BY '\n'
STORED AS TEXTFILE
LOCATION '/data/car/cn_car_manufacturer_monthly_sales';
-- 汽车总销量表
DROP TABLE IF EXISTS cn_car_total_sales;
CREATE EXTERNAL TABLE IF NOT EXISTS cn_car_total_sales (
yr INT COMMENT '年份'
time_str STRING COMMENT '时间字符串'
sales INT COMMENT '总销量'
yoy DOUBLE COMMENT '同比增长率'
)
COMMENT '汽车总销量清洗表'
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\001'
LINES TERMINATED BY '\n'
STORED AS TEXTFILE
LOCATION '/data/car/cn_car_total_sales';
【具体问题】
## 一、**市场整体趋势分析**
1. **销量趋势分析**
- 年度/月度总销量变化趋势
- 同比增长率(YoY)分析
- 季节性波动分析(汽车销售淡旺季)
2. **市场份额演变**
- 市场集中度变化(CR4/CR8分析)
- 市场份额变化趋势
- 市场格局演变分析
## 二、**厂商竞争分析**
1. **厂商排名动态**
- 各厂商月度/年度排名变化
- 厂商排名稳定性分析
- 头部厂商竞争格局
2. **厂商表现对比**
- 不同厂商销量对比
- 市场份额对比分析
- 厂商增长趋势对比
## 三、**车型分析**
1. **车型销售表现**
- 热销车型排名及变化
- 车型生命周期分析
- 新车型上市表现
2. **价格与销量关系**
- 不同价格区间销量分布
- 价格与销量的相关性分析
- 性价比分析(销量/价格)
## 四、**细分市场分析**
1. **价格段市场分析**
- 低端、中端、高端市场销量分布
- 不同价格段市场份额变化
2. **厂商-车型矩阵分析**
- 各厂商的产品线覆盖情况
- 车型组合策略分析
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
# 快速生成mr代码
使用java语言,实现mapreduce代码开发,并将所有代码整合在一个新的 Java 类里,并在类上方记录下代码的实现目的与思路
1.数据文件:111.txt,间隔符是逗号
2.此处填具体逻辑
数据样式:
xxx
1
2
3
4
5
6
7
8
2
3
4
5
6
7
8
# 提炼核心代码及文字说明
1.动作:上传代码文件
2.输入:解析文件,获取文件内容,并识别出代码语言,分析代码逻辑,找出核心逻辑的代码,并展示出来,同时要使用文字描述出实现文件的用处及核心代码逻辑
1
2
3
4
2
3
4
# 根据csv文件分析数据分布特点
1.动作:上传csv文件
2.输入:读取csv文件,分析每个分析点的数据分布特点,给出分析结论,不要进行分析点之间的联动分析
分析点:csv文件
视频一级类目分布:major_category_count.csv
视频二级类目分布:category_count.csv
视频三级类目分布:sub_category_count.csv
TOP10作品数量分布:author_statistics.csv
TOP10点赞数分布:author_statistics.csv
TOP10平均点赞数分布:author_statistics.csv
TOP10平均评论数分布:author_statistics.csv
TOP10平均收藏数分布:author_statistics.csv
TOP10平均转发数分布:author_statistics.csv
TOP10平均粉丝数分布:author_statistics.csv
TOP10平均获赞数分布:author_statistics.csv
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
# 写课程总结
1.动作:上传代码文件/文件夹
2.输入:提取代码文件夹中pyspark的相关使用技术,总结技术关键点及难点,编写环境配置过程中的学习体会,及spark api使用感想,有什么收获,注意使用文字描述,中间不要使用代码进行补充说明
3.动作:提取上个步骤的相关技术描述文本
4.将以下文本,用学生的语气重新编写一段课后总结经验体会,500字左右,不要进行任何重点标识和分段,就单纯的一段话
1
2
3
4
5
6
2
3
4
5
6
# 生成课设报告模板
这是一个大学的大数据课程设计,依据以下内容,生成一个课设报告
1
2
3
2
3
# hiveSQL转MySQL
提取hive sql语句中的涉及到的表,将其转换为MySQL的建表格式,可以模仿下面的MySQL建表格式
MySQL建表格式:
DROP TABLE IF EXISTS test_table;
CREATE TABLE IF NOT EXISTS test_table (
field1 VARCHAR(128)COMMENT 'field1',
field2 VARCHAR(128) COMMENT 'field2',
field3 VARCHAR(256) COMMENT 'field3'
) ENGINE = InnoDB,
DEFAULT CHARSET = utf8mb4,
COLLATE = utf8mb4_unicode_ci,
COMMENT = '测试表';
1
2
3
4
5
6
7
8
9
10
11
12
13
14
2
3
4
5
6
7
8
9
10
11
12
13
14
# 基于Trae快速设计出一套前端网页
第一步
1.设计实现一个PC端的纯html(html+js+css)的可视化项目
2.要具备登录页面,注册页面及可视化页面侧边导航栏,整体背景要符合"xxx"的主题
3.注册页面具备用户名,用户昵称,密码,确认密码等选项,成功注册完成后,会跳转回登录页面
4.登录成功后,在可视化页面会显示用户昵称,左边是侧边导航栏,右边是可视化图表展示区域
5.可视化页面中,左边是侧边导航栏,右边是echarts可视化图表展示区域
6.导航栏中有8个标签,分别为:"出行分析","订单分析","消费分析","车辆分布","热门区域分布","订单高峰期top10","一天内每小时订单数分布","统计收入最高的司机top10"
7.点击导航栏标签,图表展示区域可以进行切换,并显示多个echarts图表,图表分布可以用任意布局
8.导航栏标签要有好看的动态效果,最好有个好看的背景图
9.在可视化页面的合适的区域,添加一个登出按钮,点击按钮后,可以清空缓存数据,并返回到登录页面
10.交互增强:添加悬停提示、图表联动等交互功能
11.色彩系统:使用统一色系区分不同维度数据
12.动态效果:添加加载动画、过渡效果提升用户体验
1.设计实现一个PC端的纯html(html+js+css)的可视化项目
2.要具备登录页面,注册页面及可视化页面侧边导航栏,整体背景要符合"xxx"的主题
3.注册页面具备用户名,用户昵称,密码,确认密码等选项,成功注册完成后,会跳转回登录页面
4.登录成功后,在可视化页面会显示用户昵称,左边是侧边导航栏,右边是可视化图表展示区域
5.可视化页面中,左边是侧边导航栏,右边是echarts可视化图表展示区域
6.导航栏中有8个视图标签,分别为:"出行分析","订单分析","消费分析","车辆分布","热门区域分布","订单高峰期top10","一天内每小时订单数分布","统计收入最高的司机top10"
7.每个标签都有单独的html文件,当点击某个标签后,该标签会处于激活状态,右侧展示区域会切换为对应的视图html,其他标签的视图会被隐藏掉
8.导航栏标签要有好看的动态效果,最好有个好看的背景图
9.在可视化页面的合适的区域,添加一个登出按钮,点击按钮后,可以清空缓存数据,并返回到登录页面
10.交互增强:添加悬停提示、图表联动等交互功能
11.色彩系统:使用统一色系区分不同维度数据
12.动态效果:添加加载动画、过渡效果提升用户体验
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
第二步
调整"订单分析"标签下的图表,生成1个echarts图表,具体要求如下:
1.柱状图(city,station_count)
2.交互增强:添加悬停提示、图表联动等交互功能
3.色彩系统:使用统一色系区分不同维度数据
4.动态效果:添加加载动画、过渡效果提升用户体验
DROP TABLE IF EXISTS city_transfer_level;
CREATE TABLE city_transfer_level
(
city VARCHAR(255) COMMENT '城市名称',
transfer_level INT COMMENT '换乘等级',
station_count INT COMMENT '站点数量'
)
ENGINE=InnoDB
COMMENT='查询各城市换乘站换乘等级';
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
第三步
调整图表展示区域,运行图表自适应
1
2
3
2
3
# 基于GPT快速设计出一套数据仓库
请根据这套数据仓库开发流程设计一款关于汽车销售数据的数据仓库,以下是对汽车数据的描述:
这是是car_prices.csv中的数据
year make model trim body transmission vin state condition odometer color interior seller mmr sellingprice saledate
2015 Kia Sorento LX SUV automatic 5xyktca69fg566472 ca 5 16639 white black kia motors america, inc 20500 21500 Tue Dec 16 2014 12:30:00 GMT-0800 (PST)
2015 Kia Sorento LX SUV automatic 5xyktca69fg561319 ca 5 9393 white beige kia motors america, inc 20800 21500 Tue Dec 16 2014 12:30:00 GMT-0800 (PST)
2014 BMW 3 Series 328i SULEV Sedan automatic wba3c1c51ek116351 ca 4.5 1331 gray black financial services remarketing (lease) 31900 30000 Thu Jan 15 2015 04:30:00 GMT-0800 (PST)
2015 Volvo S60 T5 Sedan automatic yv1612tb4f1310987 ca 4.1 14282 white black volvo na rep/world omni 27500 27750 Thu Jan 29 2015 04:30:00 GMT-0800 (PST)
2014 BMW 6 Series Gran Coupe 650i Sedan automatic wba6b2c57ed129731 ca 4.3 2641 gray black financial services remarketing (lease) 66000 67000 Thu Dec 18 2014 12:30:00 GMT-0800 (PST)
2015 Nissan Altima 2.5 S Sedan automatic 1n4al3ap1fn326013 ca 1 5554 gray black enterprise vehicle exchange / tra / rental / tulsa 15350 10900 Tue Dec 30 2014 12:00:00 GMT-0800 (PST)
2014 BMW M5 Base Sedan automatic wbsfv9c51ed593089 ca 3.4 14943 black black the hertz corporation 69000 65000 Wed Dec 17 2014 12:30:00 GMT-0800 (PST)
2014 Chevrolet Cruze 1LT Sedan automatic 1g1pc5sb2e7128460 ca 2 28617 black black enterprise vehicle exchange / tra / rental / tulsa 11900 9800 Tue Dec 16 2014 13:00:00 GMT-0800 (PST)
2014 Audi A4 2.0T Premium Plus quattro Sedan automatic wauffafl3en030343 ca 4.2 9557 white black audi mission viejo 32100 32250 Thu Dec 18 2014 12:00:00 GMT-0800 (PST)
2014 Chevrolet Camaro LT Convertible automatic 2g1fb3d37e9218789 ca 3 4809 red black d/m auto sales inc 26300 17500 Tue Jan 20 2015 04:00:00 GMT-0800 (PST)
2014 Audi A6 3.0T Prestige quattro Sedan automatic wauhgafc0en062916 ca 4.8 14414 black black desert auto trade 47300 49750 Tue Dec 16 2014 12:30:00 GMT-0800 (PST)
这是数据说明:
汽车数据集car_prices:
make(制造商):汽车的制造商,如Toyota、Ford等。
model(型号):汽车的具体型号,如Corolla、Mustang等。
year(年份):汽车的生产年份。
trim(配置):汽车的配置级别,如LX、EX等。
body(车身类型):汽车的车身类型,如Sedan(轿车)、SUV(运动型多功能车)等。
transmission(变速箱类型):汽车的变速箱类型,如自动(automatic)、手动(manual)等。
vin(车辆识别号):汽车的唯一识别码。
state(状态):汽车的状态,如新(new)、二手(used)等。
condition(状况):汽车的状况评分。
odometer(里程表):汽车的行驶里程。
color(颜色):汽车的颜色。
interior(内饰):汽车的内饰颜色。
seller(销售商):销售汽车的公司或个人。
mmr(市场中值价格):汽车的市场中值价格。
sellingprice(销售价格):汽车的实际销售价格。
saledate(销售日期):汽车的销售日期。
现在要求使用hive实现数据仓库的开发和设计
1.数仓每个层级(ODS,DWD,DWM,DWS,ADS)的设计与实现
2.设计包含表名,及做出的数据清洗逻辑说明
3.实现包含hive sql代码
4.DWS层级需要从各字段维度去设计,每个字段维度要设计3种表
5.ADS层级进行数据分析,要求具有8种分析实现,每个分析结果保存为内部表,表命名要规范
6.ODS用外部表建表方式,DWD,DWM,DWS,ADS都使用内部表建表方式
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
# 工作职责
在尽量不瞎编的情况下,基于核心原则,丰富以下工作职责
参与负责实时数仓体系的实时etl功能。实现实时etl快速开发,通过外部sql文件方式,自动将数据格式化输出到mysql/kafka/phoenix等数据存储组件,承担80%的etl功能开发。其中,实现phoenix等版本尚未支持的connector功能。
核心原则:3 个 “不”+3 个 “要”
❶ 3 个 “不”:避开无效描述
不写流水账:拒绝 “负责日常数据录入、整理报表、对接客户” 这类无重点的日常工作;
不模糊表述:避免 “参与了项目、协助完成任务” 等没有具体动作和结果的表述;
不脱离岗位:所有职责都要匹配招聘 JD 的核心要求(比如 JD 强调 “数据分析能力”,就重点写数据相关成果)。
❷ 3 个 “要”:突出价值感
要 “动词开头”:用精准的动作词体现主动性(如 “主导、设计、优化、突破、解决”);
要 “量化成果”:用数据说话(如 “提升 30%、节省 5 万元、覆盖 10 万用户”),没有硬数据就用 “定性成果”;
要 “匹配 JD”:提取招聘要求中的关键词(如 “Spark、用户增长、流程优化”),融入职责描述。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
2
3
4
5
6
7
8
9
10
11
12
13
14
15