福安市代理做网站wordpress 指定文章链接

张小明 2026/1/19 20:40:19
福安市代理做网站,wordpress 指定文章链接,做产品代理上哪个网站好,qq推广赚钱文章目录 0 简介1. 数据集说明2. 数据处理2.1 数据导入2.2 数据清洗 3.数据分析可视化3.1 用户流量及购物情况3.2 用户行为转换率3.3 用户行为习惯3.4 基于 RFM 模型找出有价值的用户3.5 商品维度的分析 0 简介 今天学长向大家介绍一个机器视觉的毕设项目#xff0c;大数据电…文章目录0 简介1. 数据集说明2. 数据处理2.1 数据导入2.2 数据清洗3.数据分析可视化3.1 用户流量及购物情况3.2 用户行为转换率3.3 用户行为习惯3.4 基于 RFM 模型找出有价值的用户3.5 商品维度的分析0 简介今天学长向大家介绍一个机器视觉的毕设项目大数据电商用户行为分析及可视化(源码论文)项目运行效果毕业设计 基于大数据淘宝用户行为分析 项目分享:见文末!1. 数据集说明这是一份来自淘宝的用户行为数据时间区间为 2017-11-25 到 2017-12-03总计 100,150,807 条记录大小为 3.5 G包含 5 个字段。2. 数据处理2.1 数据导入将数据加载到 hive, 然后通过 hive 对数据进行数据处理。-- 建表droptableifexistsuser_behavior;createtableuser_behavior(user_idstringcomment用户ID,item_idstringcomment商品ID,category_idstringcomment商品类目ID,behavior_typestringcomment行为类型枚举类型包括(pv, buy, cart, fav),timestampintcomment行为时间戳,datetimestringcomment行为时间)rowformat delimitedfieldsterminatedby,linesterminatedby\n;-- 加载数据LOADDATALOCALINPATH/home/getway/UserBehavior.csvOVERWRITEINTOTABLEuser_behavior;2.2 数据清洗数据处理主要包括删除重复值时间戳格式化删除异常值。--数据清洗去掉完全重复的数据insertoverwritetableuser_behaviorselectuser_id,item_id,category_id,behavior_type,timestamp,datetimefromuser_behaviorgroupbyuser_id,item_id,category_id,behavior_type,timestamp,datetime;--数据清洗时间戳格式化成 datetimeinsertoverwritetableuser_behaviorselectuser_id,item_id,category_id,behavior_type,timestamp,from_unixtime(timestamp,yyyy-MM-dd HH:mm:ss)fromuser_behavior;--查看时间是否有异常值selectdate(datetime)asdayfromuser_behaviorgroupbydate(datetime)orderbyday;--数据清洗去掉时间异常的数据insertoverwritetableuser_behaviorselectuser_id,item_id,category_id,behavior_type,timestamp,datetimefromuser_behaviorwherecast(datetimeasdate)between2017-11-25and2017-12-03;--查看 behavior_type 是否有异常值selectbehavior_typefromuser_behaviorgroupbybehavior_type;3.数据分析可视化3.1 用户流量及购物情况--总访问量PV总用户量UVselectsum(casewhenbehavior_typepvthen1else0end)aspv,count(distinctuser_id)asuvfromuser_behavior;--日均访问量日均用户量selectcast(datetimeasdate)asday,sum(casewhenbehavior_typepvthen1else0end)aspv,count(distinctuser_id)asuvfromuser_behaviorgroupbycast(datetimeasdate)orderbyday;--每个用户的购物情况加工到 user_behavior_countcreatetableuser_behavior_countasselectuser_id,sum(casewhenbehavior_typepvthen1else0end)aspv,--点击数sum(casewhenbehavior_typefavthen1else0end)asfav,--收藏数sum(casewhenbehavior_typecartthen1else0end)ascart,--加购物车数sum(casewhenbehavior_typebuythen1else0end)asbuy--购买数fromuser_behaviorgroupbyuser_id;--复购率产生两次或两次以上购买的用户占购买用户的比例selectsum(casewhenbuy1then1else0end)/sum(casewhenbuy0then1else0end)fromuser_behavior_count;小结2017-11-25 到 2017-12-03 这段时间PV 总数为 89,660,671 UV 总数为 987,991。从日均访问量趋势来看进入 12 月份之后有一个比较明显的增长猜测可能是因为临近双 12 电商活动引流产生另外2017-12-02 和 2017-12-03 刚好是周末也可能是周末的用户活跃度本来就比平常高。总体的复购率为 66.01%说明用户的忠诚度比较高。3.2 用户行为转换率--点击/(加购物车收藏)/购买 , 各环节转化率selecta.pv,a.fav,a.cart,a.fava.cartasfavcart,a.buy,round((a.fava.cart)/a.pv,4)aspv2favcart,round(a.buy/(a.fava.cart),4)asfavcart2buy,round(a.buy/a.pv,4)aspv2buyfrom(selectsum(pv)aspv,--点击数sum(fav)asfav,--收藏数sum(cart)ascart,--加购物车数sum(buy)asbuy--购买数fromuser_behavior_count)asa;小结2017-11-25 到 2017-12-03 这段时间点击数为 89,660,671 收藏数为 2,888,258加购物车数为5,530,446购买数为 2,015,807。总体的转化率为 2.25%这个值可能是比较低的从加到购物车数来看有可能部分用户是准备等到电商节日活动才进行购买。所以合理推断一般电商节前一段时间的转化率会比平常低。3.3 用户行为习惯-- 一天的活跃时段分布selecthour(datetime)ashour,sum(casewhenbehavior_typepvthen1else0end)aspv,--点击数sum(casewhenbehavior_typefavthen1else0end)asfav,--收藏数sum(casewhenbehavior_typecartthen1else0end)ascart,--加购物车数sum(casewhenbehavior_typebuythen1else0end)asbuy--购买数fromuser_behaviorgroupbyhour(datetime)orderbyhour;--一周用户的活跃分布selectpmod(datediff(datetime,1920-01-01)-3,7)asweekday,sum(casewhenbehavior_typepvthen1else0end)aspv,--点击数sum(casewhenbehavior_typefavthen1else0end)asfav,--收藏数sum(casewhenbehavior_typecartthen1else0end)ascart,--加购物车数sum(casewhenbehavior_typebuythen1else0end)asbuy--购买数fromuser_behaviorwheredate(datetime)between2017-11-27and2017-12-03groupbypmod(datediff(datetime,1920-01-01)-3,7)orderbyweekday;小结晚上21点-22点之间是用户一天中最活跃的时候凌晨 4 点则是活跃度最低的时候。一周中工作日活跃度都差不多到了周末活跃度有明显提高。3.4 基于 RFM 模型找出有价值的用户RFM 模型是衡量客户价值和客户创利能力的重要工具和手段其中由3个要素构成了数据分析最好的指标分别是R-Recency最近一次购买时间F-Frequency消费频率M-Money消费金额--R-Recency最近一次购买时间, R值越高一般说明用户比较活跃selectuser_id,datediff(2017-12-04,max(datetime))asR,dense_rank()over(orderbydatediff(2017-12-04,max(datetime)))asR_rankfromuser_behaviorwherebehavior_typebuygroupbyuser_idlimit10;--F-Frequency消费频率, F值越高说明用户越忠诚selectuser_id,count(1)asF,dense_rank()over(orderbycount(1)desc)asF_rankfromuser_behaviorwherebehavior_typebuygroupbyuser_idlimit10;--M-Money消费金额数据集无金额所以就不分析这一项对有购买行为的用户按照排名进行分组共划分为5组前 - 1/5 的用户打5分前 1/5 - 2/5 的用户打4分前 2/5 - 3/5 的用户打3分前 3/5 - 4/5 的用户打2分前 4/5 - 的用户打1分按照这个规则分别对用户时间间隔排名打分和购买频率排名打分最后把两个分数合并在一起作为该名用户的最终评分withcteas(selectuser_id,datediff(2017-12-04,max(datetime))asR,dense_rank()over(orderbydatediff(2017-12-04,max(datetime)))asR_rank,count(1)asF,dense_rank()over(orderbycount(1)desc)asF_rankfromuser_behaviorwherebehavior_typebuygroupbyuser_id)selectuser_id,R,R_rank,R_score,F,F_rank,F_score,R_scoreF_scoreASscorefrom(select*,casentile(5)over(orderbyR_rank)when1then5when2then4when3then3when4then2when5then1endasR_score,casentile(5)over(orderbyF_rank)when1then5when2then4when3then3when4then2when5then1endasF_scorefromcte)asaorderbyscoredesclimit20;小结可以根据用户的价值得分进行个性化的营销推荐。3.5 商品维度的分析--销量最高的商品selectitem_id,sum(casewhenbehavior_typepvthen1else0end)aspv,--点击数sum(casewhenbehavior_typefavthen1else0end)asfav,--收藏数sum(casewhenbehavior_typecartthen1else0end)ascart,--加购物车数sum(casewhenbehavior_typebuythen1else0end)asbuy--购买数fromuser_behaviorgroupbyitem_idorderbybuydesclimit10;--销量最高的商品大类selectcategory_id,sum(casewhenbehavior_typepvthen1else0end)aspv,--点击数sum(casewhenbehavior_typefavthen1else0end)asfav,--收藏数sum(casewhenbehavior_typecartthen1else0end)ascart,--加购物车数sum(casewhenbehavior_typebuythen1else0end)asbuy--购买数fromuser_behaviorgroupbycategory_idorderbybuydesclimit10;小结缺失商品维表所以没有太多分析价值。假如有商品维表可以再展开以商品纬度进行分析比如不同行业、不同产品的转化率还有竞品分析等等。项目运行效果毕业设计 基于大数据淘宝用户行为分析 项目分享:见文末!详细分析文档
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

如何做旅游网站的思维导图建站网址不安全

Python应用打包新范式:PyOxidizer深度解析 【免费下载链接】PyOxidizer A modern Python application packaging and distribution tool 项目地址: https://gitcode.com/gh_mirrors/py/PyOxidizer 在Python开发生态中,应用分发一直是一个令人困扰…

张小明 2026/1/17 17:00:46 网站建设

便宜网站建设 优帮云网站建设及推广图片

YOLOv8 Helm Chart制作尝试:云原生部署 在智能视觉应用快速落地的今天,如何将一个训练好的目标检测模型高效、稳定地部署到生产环境,已经成为AI工程化链条中最关键的一环。传统方式下,开发者常常面临“在我机器上能跑”的窘境——…

张小明 2026/1/17 17:00:46 网站建设

外国购物网站设计风格如何免费申请域名和网址

第一章:Open-AutoGLM部署想Open-AutoGLM 是一个面向自动化自然语言任务的开源大模型推理框架,支持灵活的模型加载、动态提示工程与多后端部署。其核心设计理念是将大语言模型的能力封装为可编程接口,便于集成至企业级应用中。环境准备 部署 O…

张小明 2026/1/17 17:00:50 网站建设

响应式网站代理wordpress树形导航菜单

腾讯混元Hunyuan3D-2mini:快速生成3D资产新工具 【免费下载链接】Hunyuan3D-2mini 腾讯混元Hunyuan3D-2mini是轻量级开源3D生成模型,0.6B参数规模较前代1.1B更小更快,支持文本/图像转3D资产,基于扩散模型生成高分辨率纹理3D模型&a…

张小明 2026/1/17 17:00:50 网站建设

青岛建设网站公司wordpress更换中文

Qwen3-8B:轻量级大模型如何重塑本地编程辅助体验 在开发者工具的演进史上,AI 驱动的代码补全曾被视为“未来功能”。直到 GitHub Copilot 横空出世,我们才真正意识到:一个能理解上下文、预测意图、甚至写出完整函数的大模型&#…

张小明 2026/1/17 17:00:51 网站建设

广州一起做网店网站官方公司介绍模板简短

还在为反复敲击brew install、brew upgrade而烦恼?还在为权限问题、缓存清理而头疼?作为Mac开发者或重度命令行用户,你值得拥有更优雅的解决方案。 【免费下载链接】Pearcleaner Open-source mac app cleaner 项目地址: https://gitcode.co…

张小明 2026/1/17 17:00:51 网站建设