python基本输入输出
51CTO博客开发
怎么理解编码?为什么要编码?在计算机中,只认0,1,二进制。所以当你输入个一个字母,它在内存中就对应这某个二进制,如00001111 ,8位二进制。各种编码的区别?常见的有ACILL编码,Unicode编码,和UTF-8编码ACILL编码只用8位二进制,空间范围为0-255,只能区分256个字符,但是汉字不只有几万个,所以就得必须用两个8位二进制,来进行存储,所以就得用16位二进制,存储。这个就是
1. 什么是集成学习?集成学习通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统。基于同种类型的个体学习器,这样集成是同质,不同种类型的个体是异质的。2. 集成学习方法大致分为哪两大类?个体学习器间存在强依赖关系,必须串行生成的序列化方法,前者的代表是Boosting族。个体学习器不存在强依赖关系,可同时生成的并行化方法,后者的代表是Bagging和随机森林。Bo
支持向量机是一种二分类模型。它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使他有别于感知机;支持向量机还包括核技巧,这使它成为实质上的非线性分类器。支持向量机的学习策略就是间隔最大化。可形式化为一个求解凸二次规划的问题。当训练数据线性可分时,通过硬间隔最大化,学习一个线性的分类器,即线性可分支持向量机当训练数据近似线性可分的时候,通过软间隔最大化,也学习一个线性的分类器,即线性支持
决策树的分类速度快决策树有个步骤:特征选择,决策树生成,和决策树的修剪。特许选择:在于选取对训练数据具有分类能力的特征,这样可以提高决策树学习的效率。如果利用一个特征进行分类的结果与随机分类的结果没有很大差别,则称这个特征是没有分类能力的。经验上任掉这些的特征对决策树学习的精度影响。通常特征选择的准则是信息增益,或信息增益比。在学习信息增益的时候,首先是要了解一个概念:熵(entropy)是表示随
朴素贝叶斯算法如何理解?朴素贝叶斯算法是一个生成式的一个算法我们的目的就是分类判断当前的实例x是那个类别的,但是生成式是这样的p(Ck/x)在实际问题中我们通常知道p(Ck)这个叫做先验概率。我们也会知道p(x/ck)中的个数,这种条件概率那怎么求 p(Ck/x)呢?首先是将条件概率分布转换成p(Ck,x)全分布/p(x)再将全分布转换成逆条件概率p(Ck)p(x/Ck) ,之后,在将p(x/Ck
第一个问题就是k值的选取问题?怎么快速找到k个邻居,尤其是在特征空间维数大及训练数据容量大时尤其必要。(1)k值的问题:当k值很小的时候,就相当于在较小的领域中训练实例进行预测,学习的近似误差会减小,只有与输入实例较近的训练实例才会对预测结果起作用(反过来想,离的越近,肯定越相似,离得越远,相似度就差很大)。但缺点是学习的估计误差会增大,预测结果会对近邻的实例点非常敏感,如果近邻的实例点恰巧是噪声
数据集:关系型数据库中有很多表,表里面有很多记录,很多记录就可以认为是数据集属性(特征):一个表中有很多条记录,每条记录的表有很多属性,如tb_stu(stu_id,stuname,stu_sex)s表中有3条属性属性值:属性的取值,如stu_id可以等于1,2.3....n。stu_sex可以为男,也可以为女。特征向量:我们可以将属性的组合投影到三维空间,用几何和代数的工具来表示他们。如三个属性
每次体会算法都有新的感觉,刷题越多,对算法的理解感觉也就越深刻。下面我们来重新体会下分治法,动态规划,贪心法,递归的理解。1.分治法: 将问题分成单独的阶段,每个阶段互相不干扰很独立,如10米长的木棍,切成10段,每段去解决每一段的问题。(阶段没有关系)2.贪心法 站在全局的角度,也是将问题堪称分为多个阶段,只不过阶段和阶段之间有一定的递进关系,如
优先使用组合,然后通过注入方式,进行赋值给类中的对象使用继承面向切面编程。(比如对某个类增加日志功能,怎么增加)为什么优先使用组合,因为基类一旦变化,子类都会跟着变化。
面向对象和面向过程的区别?如果说面向对象和面向过程的具体区别,最深入的地方应该是去看设计模式,推荐大话设计模式那本书,讲的比较好。本人只不过简单叙述下,重点是如何进行面向对象和面向过程的编程,只有会编程了,才能真正懂得面向对象和面向过程的区别。否则都是纸上谈兵。面向过程:是以计算机线性思维的方式进行编程。一步一个脚印的执行。本身也没有问题,但是如果遇到需求多变的情况,或者功能的添加和删除,将极其影
什么是极大似然估计?参数估计就是通过若干次试验,已知某个参数能使这个样本出现的概率最大,我们当然不会再去选择其他小概率的样本,所以干脆就把这个参数作为估计的真实值。说的是已知某个随机样本满足某种概率分布,但是其中具体的参数不清楚,我们通过最大概率反过来求其的参数值。极大似然估计的原理?一个随机试验如有若干个可能的结果A,B,C,…。若在仅仅作一次试验中,结果A出现,则一般认为试验条件对A出现有利,
什么是数据结构?逻辑结构: ADT=(V,R) V:表示顶点结合 R 表示数据元素与数据元素之间的关系。数据结构其实将 ==>结点对应到结
序列图的重要性这个序列图的重要性不仅仅表现在它在使用软件工程和软件开发中,甚至是表现在某些算法当中,当然作为一个学计算机的人,你可以把它使用放在任何你觉得能够看得懂的地方去。序列图是干什么用的?序列图就是表示对象之间调用的顺序。序列图中元素的组成部分有哪些?生命线:用竖着的虚线表示,表示生命的周期,当然这个生命周期也可以差掉,因为你将对象给销毁了,比如经常会用到free(p)控制焦点:用矩形框表示
面向对象有几种关系泛化和实现关联和依赖关系理解泛化:就是继承 实线带三角形实现:就是实现接口  
算法设计基本方法有什么好处?了解常见的算法设计方法以及它们之间的区别,有利于构建算法思维的广度,有充分的理论知识。当然,如果算法思维的深度再好的话,将来你见识的算法越多,天下之间所有的算法,都会融入到你的理论和实践当中。常见算法分类穷举法(暴力法,蛮力法)它的基本思想是分别列出所有各种可能解,测试其是否满足条件,若是则输出。回溯法:有通用的解题法之称,是一种将问题的所有解组织的仅仅有条,能避免不必
如何理解面向对象?什么是面向对象,面向对象其实就是一种设计模型。不用理解太多,这里不是最重要。面向对象的基本特征如何理解?1)抽象:将相同事物抽象出来成为一种数据结构,或者是用类(面向对象),或者是用结构体(面向过程)比如KNN算法,求解测试样本的k个邻接点,这k个邻接点,甚至整个邻接点都可以抽象出来一种数据结构。在比如决策树算法中,构建决策树,由于一个决策树有多个结点,结点和结点之间互相生成。首
机器学习中回归(自变量x和应变量y)之间的关系由两种?确定性关系(函数关系):如线性相关,能够找到函数或者曲线能够进行拟合。非确定性关系(相关关系):如正相关,或者负相关。如何判断这些散点,是否可以用直线进行拟合?我们可以算法它们之间的x和y的相关系数: 算出它们之间的相关系数,相关系数越大,则越可以用直线进行拟合。3.怎么求拟
术语理解示例: 对应着数据中的一条记录(多条记录构成数据集)。可以包含标记,也可以不包含标记。 假设一条记录有多个属性构成的,则这条记录就有5维。多个属性构成的空间叫做属性空间,样本空间(示例也可以叫做样本)或者输入空间。每个属性都有多个属性取值,则每条记录都
接口和抽象类经常是设计模式经常使用的东西,如何来进行选择呢?接口和抽象类其实表示事物与事物之间的联系的一种关系的体现接口更多的体现的是like A的关系,而抽象类更多的是is A的关系如果这两个类他们之间确实无形中体现出is A的关系,比如毛和狗都是动物的一种,则可以写抽象类。而如果这两个类它们之间的行为很像,则它们体现出了一种Like A的关系,如媒婆代理别人去相亲,那么本身就体现了一种方法,则
hadoop完全分布式的搭建思路?jdk必须安装,所有机器都是一样的。环境变量是PATH,但是在配置PATH的时候,一定要加上.;这是系统原来的环境变量,如果不加这个,可能再次开不出机器。Hadoop安装,可以放在yarn,也可以不放在yarn,环境变量HADOOP_HOME,JAVA_HOME(这个主要是切换jdk来用的,j2ee就是这样的)所有机器的host里面必须有对应的主机,各个子节点的I
排序经常会用,但是怎么在大数据中,以Map,Reduce这种形式来进行实现了?首先你要明确目标对象,对谁进行排序,如果是自定义的对象,需要实现其CompareTo方法,因为这个是对象之间比较大小的方法。另外你需要设计排序策略,特殊情况,正常情况,编程的时候,应该先写特殊情况,最后写正常情况,这样的话,逻辑更加清晰。如何设计呢?首先按照正常逻辑写好Map和Reduce程序,然后输出,最后得到的是一些
partioner在Hadoop中是干什么的?其实这个都是为shuffle服务的,怎么说,其实就是根据一些策略,将这个分区里面的那些数据分配给哪个reducer,举个例子,有很多关键字key1,text1,key2,text2,有两个reducer1,reducer2,为什么会将key1,走的是reduce1,key2,走的是reduce2,为什么会这样,这就看它分区的策略了。partioner可
虚拟机软件中各种虚拟机的配置讲解?虚拟机中有3中网络方式a)网桥方式,真机和虚拟机进行通信,都必须在一个网络里面,前提是你必须要有这么多的IP地址,如果是在实验室,还真没有这么多的IP地址。(那么每台虚拟机的网卡在哪里呢,一般都是etho,自己在虚拟机网络里面找)。b)NAT方式,是分成内网和外网进行通信的,一般来说,它们之间通信的端口是VmareNet 8(那么每台虚拟机的网卡在哪里呢,一般都是
我们再编程的时候,经常会出现这样的代码,你是否有过疑惑?//第一句代码返回了一个RDDVal a=sc.parallelize(List("bit","linc","xwc","fjg","wc","spark"),3)//这句代码疑惑在这里,计算每个元素的单词长度呢?Val b=a.map(word=>word.length)//上面的代码a,与b都是RDD,从a-到b它的RDD是如何转换
以前学过很长时间反射机制,很是不理解?今天终于看到一本书讲的很详细。所有反射机制都是通过一个类叫做Class来实现:让我看看书上是怎么介绍的ClassClass是java.lang包中的类,该类的实例用来封装对象运行时的状态。当一个类被加载且创建对象时,和该类相关的一个类型为Claas的对象就会自动创建。Class类本身不提供构造方法,因此,不能使用new来构造对象任何对象调用getClass()
学过socket编程,就应该明白当我们做一个socket客户端,socket服务器,两边使用socket进行通信,而现在我们使用b/s模式来做网站开发系统,我们使用的是浏览器,浏览器就相当于socket客户端,而服务器也就相当于我们的socket服务器,那么到底什么才是服务器呢?服务器就是一段代码,sun公司我们提供了tomcat,只不过这个服务器比我们写的s
1.java集合框架到底是什么?Java集合框架,就是对数据结构书中的常见的数据数据结构,进行封装。2.集合框架的架构是什么?都是通过一些接口和一些实现接口的类来构造数据结构中常见的数据结构。自然就拥有了增加,删除,查询,遍历,求其长度,将其置为空的方法。Java中就是add(),remove,get/contain(),iterable(),size(),clear();集合框架中主要有2大接口
什么是socket,以及两端ServerSocket和Socket是真正的干什么用的,也终于理解到其实普通的socket也就仅仅是普通管道,两边通过这个管道互相传和接受信息。建立Socket连接建立Socket连接至少需要一对套接字,其中一个运行于客户端,称为ClientSocket,另一个运行于服务器端,称为ServerSocket。套接字之间的连接过程分为三个步骤:(1)服务器监听
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号