【python】seaborn绘制箱线图
公开笔记对他人可见,有机会被管理员评为“优质笔记”
{{ noteEditor.content.length }}/2000
包含本视频的课程:
图像三要素-点线元素讲解
探讨了数据可视化中图形元素的点和线配置,详细介绍了如何在R语言中设置点的样式(PCS)、颜色(COL)和大小(CEX),并说明了点样式参数(PCH)的灵活应用,如通过数字或特殊符号定义不同形状。还涉及了线元素的设置,包括线条样式(LTY)、颜色和粗细(LWD),及如何通过循环结构生成不同样式的线。内容适合对数据可视化、编程绘图及R语言有兴趣或需要进行图形定制化展示的技术人员。
10:273882dfply基础入门
视频演示了如何使用Python的DFPLY库进行数据处理,重点介绍了管道符号(两个大于号)的使用,它像水管过滤器一样,可以将数据流从一个操作导向下一个操作。演示用大写的X作为data frame的符号进行数据列的操作,通过示例展示了如何查看数据的前几行与数据操作不影响原始数据集。还讨论了使用大于号与等于号组合的管道符号和DFPLY内置的过滤函数进行数据筛选的不同场景。此外,视频还比较了使用data frame的列名、列索引号进行子集提取的不同方法,并提供了代码示例加深理解。内容适合需要处理数据集,希望提高数据处理效率和精准度的Python程序员和数据分析师观看。
14:273705plotnine语法框架及函数分类
本视频深入探讨了数据可视化中几何图层、统计变换、美化元素、坐标系和分面板的应用。讲解了如何通过几何对象(geom)创建不同类型的图形,包括直方图、散点图等,以及如何使用统计变换(stat)来表现数据的统计特性。此外,讲师还阐述了图层颜色映射(aes)的原理,解释了如何设定图形的视觉属性,如坐标轴、颜色、形状和大小,并提到了图例和主题的调整方法,以及文本标签和注释的添加。视频还介绑了变量类型(连续型、离散型)对图表选择的影响,并通过实例展示了如何进行数据可视化的定制和优化。内容主要适合对数据分析、可视化和统计有兴趣的从业者以及学习者。
10:293581Python性能这么差,为什么会在AI中大量使用
尽管Python相较于C++性能较低,但在AI领域占主导的原因在于它作为粘合剂角色的效能与扩展性。Python在数据交互方面与C++或显卡紧密结合,AI行业对此依赖重大。更重要的,科学家原先为替换Fortran选用Python,进而形成强大的科学计算生态。Python的数学库如NumPy在科学计算界获广泛应用,助推了其在AI领域的延续。实际上,在金融AI公司的真实案例中,Python用于快速原型开发,而生产环境转向性能更优的C++。同时,Python全局锁的特性在实验阶段不成问题,但正式环节需要利用C++等语言进行性能提升。
01:494.1万Python爬虫:Requests库的基本用法
本次内容聚焦于使用Python的requests库进行网页数据爬取。介绍了requests库作为一个无需转基因的HTTP库,在人类获取网页数据过程的适用性与便捷性。视频解释了如何安装库,以及如何使用GET方法来获取网页对象。其中,还包含了HTTP状态码的讲解,状态码帮助开发者识别HTTP请求的响应状态。强调了文本编码的重要性,在处理爬取到的文本数据时需设置合适的编码以避免乱码问题。此外,视频提供了通过requests库对网页文本信息提取的具体代码实例演示,旨在帮助开发者理解如何使用这一工具进行数据抓取。
07:323.4万python中的__init__.py文件有什么作用?
讨论了Python中`__init__.py`文件的作用,包括它如何使文件夹被识别为包,以及其在Python3.3版本前后的变化。文件的主要用途是声明文件夹为包并允许导入其中的模块,以及作为包初始化时执行的代码块。这允许执行包中`__init__.py`文件中的代码,再导入包中其他模块的代码,并能用于导入不同目录的包内容,同时涉及到对模块命名空间的初始化。内容适合有兴趣了解Python包结构及模块导入机制的开发者和学习者。
02:223.4万大数据架构与生态圈01
视频内容聚焦于大数据技术的发展三个阶段,其中大数据1.0时代遍及2006-2009年,以Apache基金会建立的Hadoop开源项目和相关技术(如HDFS、MapReduce、HBase)为标志,主要解决大规模结构化数据批处理问题。2.0时代自2009年至2015年,以Spark为主流计算引擎,着重于结构化数据处理与多种流计算引擎的出现。而3.0时代则自2015年开始,注重非结构化数据处理、数据共享及解决数据孤岛问题,推进大数据与人工智能、云计算技术的融合。内容指出大数据技术依据不同行业需求有不同架构,并且强调技术的持续更新与业务适配性。
09:592.6万我国大数据水平处于什么阶段?
中国大数据发展正面临硬件、软件与意识层面的挑战,尚在初级阶段。发展过程包含数据准备、存储、计算、分析及价值展现五大环节。现阶段,对大数据价值认识不足,相关领域数据未充分利用。存储环节依赖于进口核心芯片;计算管理中虚拟化产品国产化程度低;分析工具及数据库主要采用外国技术。国产化进步可加强数据安全,增强价值展现。本段内容适合关注本土技术发展、数据安全及大数据应用实践的专业人士。
02:071.2万