如何通过贝叶斯定理过滤垃圾邮件?
公开笔记对他人可见,有机会被管理员评为“优质笔记”
{{ noteEditor.content.length }}/2000
掌握朴素贝叶斯:哪个模型对鸢尾花分类更准确?
本次课程中,探讨了朴素贝叶斯算法中的三种不同的模型:多项式模型、伯努利模型和高斯模型,并以鸢尾花数据集为例进行实际应用演示。首先,我们对鸢尾花数据集进行了标准化处理,并将其划分为训练集和测试集。随后,利用多项式模型进行训练与预测,并观察到虽然具有较高的准确率,但召回率和F1值并不理想。接着更换为伯努利模型进行测试,结果依然不太好。最终使用高斯模型进行训练和预测,结果显示在这个连续性数据集上,高斯模型能提供最佳的性能,准确率、召回率以及F1值均达到百分之百。混淆矩阵也显示了预测的准确性。课程强调,对于连续型数据的分类问题,高斯模型可能是更佳的选择。同时,课程也提醒学习者注意到数据集的划分可能对模型的性能有一定的影响。
03:331012掌握K-近邻算法:高效进行数据分类预测
在本次教程中,我们探讨了如何使用机器学习中的经典算法K-近邻(KNN)来进行数据分类。首先介绍了通过SciKit-Learn(即SK)库中的neighbors包来实现算法的过程。我们使用s phone s clean input方法来调整输入数据,准备好后,进一步采用split方法对数据集进行分割。在数据处理方面,提到了不同的数据集切分方法,包括使用SK自带的工具和手动编写代码进行分割。建模方面,介绍了如何使用neighbors包中的K-近邻分类器并讨论了如何设置K值(即算法中的"neighbors"数)。默认情况下,K值被设置为5,意味着算法会考虑与测试点最近的五个样本点来预测分类。训练模型采用fit方法,并将训练数据集传入。完成模型训练后,我们使用predict方法进行预测,并基于测试集计算了几项关键的性能指标,包括准确率、召回率和F1指标。课程强调了由于测试集是随机分配的,模型的性能指标在不同运行中可能会有所不同,但通常准确率会保持在95%左右。总的来说,课程提供了一种简洁的方法来运用K-近邻算法进行机器学习建模和预测。
04:151010探秘单层感知器:当分类遇上非线性难题
单层感知器作为一种基础的机器学习模型,经常被用于解决分类问题。在上节课中我们了解到,虽然单层感知器有效,但它面临着边界划分不精准等问题,尤其是在非线性问题上存在明显的局限性。举例说明,通过编程实验,容易观察到使用单层感知器对异或运算进行模型训练时,无法通过线性分割准确地分类结果。在数据设置上,定义了四组输入数据和对应的标签,并采用了SIGN函数作为激活函数,其中激活函数的输出根据正负值决定标签是1还是-1。训练过程包括权重初始化、学习率设置和感知器参数的迭代更新。尽管进行了多次迭代,但由于非线性的复杂性,单层感知器并没有达到一个满意的分类效果,训练最终以连续迭代100次后结束,并在坐标轴上绘制了分类界限。很明显,单层感知器在解决这类非线性分类问题上遇到挑战,提醒我们需要探索更高级的模型如多层神经网络来解决此类问题。
04:12993Python性能这么差,为什么会在AI中大量使用
尽管Python相较于C++性能较低,但在AI领域占主导的原因在于它作为粘合剂角色的效能与扩展性。Python在数据交互方面与C++或显卡紧密结合,AI行业对此依赖重大。更重要的,科学家原先为替换Fortran选用Python,进而形成强大的科学计算生态。Python的数学库如NumPy在科学计算界获广泛应用,助推了其在AI领域的延续。实际上,在金融AI公司的真实案例中,Python用于快速原型开发,而生产环境转向性能更优的C++。同时,Python全局锁的特性在实验阶段不成问题,但正式环节需要利用C++等语言进行性能提升。
01:494.4万python中的__init__.py文件有什么作用?
讨论了Python中`__init__.py`文件的作用,包括它如何使文件夹被识别为包,以及其在Python3.3版本前后的变化。文件的主要用途是声明文件夹为包并允许导入其中的模块,以及作为包初始化时执行的代码块。这允许执行包中`__init__.py`文件中的代码,再导入包中其他模块的代码,并能用于导入不同目录的包内容,同时涉及到对模块命名空间的初始化。内容适合有兴趣了解Python包结构及模块导入机制的开发者和学习者。
02:223.7万Python爬虫:Requests库的基本用法
本次内容聚焦于使用Python的requests库进行网页数据爬取。介绍了requests库作为一个无需转基因的HTTP库,在人类获取网页数据过程的适用性与便捷性。视频解释了如何安装库,以及如何使用GET方法来获取网页对象。其中,还包含了HTTP状态码的讲解,状态码帮助开发者识别HTTP请求的响应状态。强调了文本编码的重要性,在处理爬取到的文本数据时需设置合适的编码以避免乱码问题。此外,视频提供了通过requests库对网页文本信息提取的具体代码实例演示,旨在帮助开发者理解如何使用这一工具进行数据抓取。
07:323.6万人人都有自己的智能体!从0到1构建本地开源大语言模型智能体原理与实现
本次分享主要介绍了智能体的工作原理及其在技术实现中的应用。智能体被比喻为一个具有手脚和感官的完整人,能够根据大脑的指令执行任务。通过本地大语言模型,结合VLLN框架,智能体能够调用工具、进行搜索、执行代码,并具备记忆功能。分享中还讨论了智能体在解决问题时的行动决策过程,以及如何通过JSON格式与工具进行交互。此外,还演示了使用搜索引擎和AI绘画工具的实例,并最终展示了智能体执行任务的完整流程。这些内容适合对人工智能、自然语言处理和智能体设计感兴趣的技术人员学习。
31:523.2万【职场秘籍】怎样安全的度过试用期?快来get试用期“安全攻略”!
在职场中安全度过试用期关键在于明确个人定位与积极主动的工作态度。成功案例描述了一个口才良好的学员如何因过度包装自己导致职位不匹配而被辞退,而失败案例则讲述了即便技术能力强,因缺乏主动沟通和团队协作而多次被辞退。从这些案例中可以看出,对于新人而言,既要真实展示自己的技术水平,又要积极融入团队,保持与周围同事的良好沟通。此外,及时向上级报告工作进展、遇到问题时主动寻求帮助,也是确保试用期顺利过关的重要因素。适应职场,不仅需要扎实的技术功底,还必须具备良好的工作态度与沟通协作能力。
18:382.6万
![机器学习算法基础](https://s2.51cto.com/images/201812/17/47a575249543319fb6b5077f95e14e8f.jpg?x-oss-process=image)
![机器学习项目实战](https://s2.51cto.com/images/202009/09/1048ca4ae9b128f46082442a7e6db6cc.png?x-oss-process=image)
![【2020新版更新】人工智能-机器学习实战视频课程( 上篇)](https://s2.51cto.com/images/201702/57c2a5651f528749a4a1711a6506b34b7b0412.png?x-oss-process=image)
![大数据——机器学习视频课程( 下篇 )](https://s2.51cto.com/images/201702/49437f824f3156e0df840630fbc0a5d9413d08.png?x-oss-process=image)
![【微职位】Python数据分析与机器学习实战课程配套视频课程](https://s2.51cto.com/images/201705/c17f89d3944a919e89219585c92443c084a6a0.png?x-oss-process=image)
![从零开始学习机器学习系列视频课程](https://s2.51cto.com/images/201712/06/b05297fbf0ba0ee5cc0689624838715f.jpg?x-oss-process=image)
![Python数据分析--玩转数据挖掘(2024版)](https://s2.51cto.com/images/202011/10/6c2a62357f61e0b62cc23fa7a7720521.png?x-oss-process=image)
![Python机器学习实训营(零基础必备,原理推导+代码复现+实验分析)](https://s2.51cto.com/images/201907/13/a4737b992965668ac23b9e7a1cf6d5b6.png?x-oss-process=image)