认识Java

Java简介 Java语言体系中,最基础的部分是Java SE,其是Java的标准版本,包含了Java的一些面向对象的特性等;Java EE是Java的企业版;Java ME用于嵌入式开发 JVM:Java Virtual Machine;JRE:Java Runtime Environment;JDK:Java Development Kits 安装步骤 安装JDK。成功标志:java »

Windows+Idea安装Hadoop开发环境

前言:这种问题,本来不应该写篇博客的,但是实在是折磨我太久了,现在终于修好了,必须记一下,否则对不起自己的时间,对自己的博客道歉 简介 环境:Windows 10+JDK1.8+Intellij Idea,无需手动安装Hadoop Maven Maven是项目管理及自动构建工具,由Apache软件基金会所提供。基于项目对象模型(缩写:POM)概念,Maven利用一个pom.xml的文件管理一个项目的构建、 »

机器学习 特征工程

特征和数据决定了机器学习效果的上限,而算法和模型不过是接近这个上限而已,因此特征工程对于机器学习是及其重要的。 一图胜前言[1]: 数据清洗 在实际的应用过程中,数据是十分的杂乱的,可能包含大量的噪音,缺失值等,所以需要通过一些方法,尽可能提高数据质量。一般包括: 分析数据 缺失值处理 异常值处理 噪音数据处理 去重处理 分析数据 python的pandas包含了一些统计和汇总统计,如: 可参见《利用Python进行数据分析》Wes Mckinney著,P144. »

PRML Chapter4

超平面(hyperplane) 超平面:超平面是n维欧氏空间中余维度等于一的线性子空间,也就是说必须是(n-1)维度。这是平面中的直线、三维空间中平面的推广(n大于3才被称为“超”平面),是纯粹的数学概念,不是现实的物理概念。 线性可分(linearly separable):分布于 D 维空间中的全部数据点可以用超平面无错地分隔成类 One-hot,Coding scheme,1-of-K binary coding »