XGBoost 梯度提升算法入门

XGBoost 最早的雏形出现在 2014 年,当时由 陈天奇 读博期间负责的研究项目中。后经开源,逐渐发展成一个支持 C++,Java,Python,R 和 Julia 语言的成熟框架。XGBoost 是 Extreme Gradient Boosting 的缩写,其中的 Gradient Boosting 实际上就是梯度提升......

在 Mac 中快速预览 Jupyter Notebook 文件

目前,Jupyter Notebook 已经成为数据科学的标配,许多机器学习工程师也会使用其快速构建模型。Jupyter Notebook 文件本身使用 JSON 存储,直接打开预览体验非常糟糕。所以,当你想要在 Mac 上快速编辑和预览 Notebook 默......

百度 Apollo 3.5 自动驾驶环境搭建指南

Apollo 是百度开源的自动驾驶开源平台,本篇文章主要用于说明 Apollo 环境搭建流程,并记录遇到的问题。 本次环境搭建选择 AWS 提供的 c5n.2xlarge 云主机,配置为 8 vCPU 和 21GB MEM,无 GPU。系统选择 AWS 提供的 Ubuntu......

PyTorch 深度学习基础入门

PyTorch 基础语法 PyTorch 是 Facebook 主导开发的,基于 Python 的科学计算包,其主要有以下两个特点: 比 NumPy 更灵活,可以使用 GPU 的强大计算能力。 开源高效的深度学习研究平台。 接下来,我们了解 PyTorch 的基础概念和......

Jupyter Notebook 中文书写指南

Jupyter Notebook 是一款优秀的 Python 交互式编程工具,并十分适合用于数据分析和机器学习工作。本指南是我个人在使用 Jupyter Notebook 撰写技术文档时遵循的格式规范。 基本规范 首先,Jupyter Notebook 内容遵循基本中文......

Keras 中 LSTM 层两个重要参数理解

keras.layers.LSTM 类中有两个常用但不容易理解的参数,分别是 return_sequences 和 return_state。对于两个参数,官方定义如下: return_sequences: 布尔值。是返回输出序列中的最后一个输出,还是全部序列。 return_state: 布尔值。除了输出之外是否返......

机器学习和深度学习思维导图

分享我在机器学习实战课程中制作的知识点思维导图,涉及机器学习、深度学习、强化学习的内容。图片均为矢量图,可缩放页面查看大图。 如果你有兴趣,欢迎 报名线上课程(联系我可以获得特邀折扣券)。思维导......

Convolutional Neural Networks in TensorFlow 总结

Convolutional Neural Networks in TensorFlow 是 deeplearning.ai 的新课程,网上很多媒体会说是吴恩达的新课,实际上教学的老师是 Laurence Moroney。 这门课课时不长,对于 TensorFlow 比较熟悉的人基本上只需要花费一上午的时间就能完整看完。事实上......

TensorFlow 2.0 构建神经网络

前面,我们以线性回归作为例子演示了 TensorFlow 2.0 的新变化和新特性。实际上,TensorFlow 等深度学习框架更重要的作用是用于构建人工神经网络。所以,本次实验将利用 TensorFlow 2.0 来构建一个简单的前......

TensorFlow 2.0 实现线性回归

线性回归是机器学习中最简单的问题,同时线性回归也与人工神经网络有千丝万缕的关系。文章中,我们将以线性回归为例,使用 TensorFlow 2.0 提供的 API 来进行实现。与此同时,我们会使用 1.x......

TensorFlow 2.0 新增变化特性

TensorFlow 2.0 版本现已推出,相对于 1.x 版本在很多地方都有较大的变动。文章中,我们将了解并学习 TensorFlow 2.0 的一些新的特征,同时熟悉一些常用的新 API 方法。 前提条件:学习此课程的前提是已......

Jupyter Notebook 中运行 Flask 应用

最近遇到一个奇怪的需求,就是要在 Jupyter Notebook 中使用 Flask。由于每一个 Jupyter Notebook 都独立运行在一个 Kernel 中,直接启动 Flask 变得不太可能。经过几次测试,最终使用子进程的方式完成了加载。 首先,把示例 Flask......

SciPy 中最小二乘法初始参数释疑

SciPy 提供了封装好的最小二乘法函数 scipy.optimize.leastsq()。根据其 官方文档 显示的完整参数所示,使用该函数时需要传入 func 损失函数,x0 初始化参数以及通过 args=() 传入样本。 scipy.optimize.leastsq(func, x0, args=(), Dfun=None, full_output=0, col_deriv=0, ftol=1.49012e-08, xtol=1.49012e-08, gtol=0.0, maxfev=0, epsfcn......

机器学习常见术语表

整理常见机器学习术语,部分内容参考自 Machine Learning Glossary,你可以通过汉语拼音首字母快速检索。 C 超参数| Hyperparameter 在机器学习中,超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。通常情况下,需要对......

Jupyter Notebook 使用小技巧

下面,列举一些 Notebook 中的使用小技巧。 快捷键 shift + 回车 → 运行单元格(当 Markdown 单元格处于编辑状态时,运行即可复原) X → 剪切单元格 C → 复制单元格 V → 粘贴单元格 连续按 D D → 删除单元格(慎用......

使用 DCGAN 生成动漫小姐姐头像

生成对抗网络是 2014 年由伊恩·古德费洛等人提出的一种非监督式学习方法 arXiv:1406.2661v1,该方法的特点是通过让两个神经网络相互博弈的方式进行学习。DCGAN 是 GAN 的一种十分实用的延伸网络,它由......

LeNet-5 卷积神经网络的 4 种实现方法

LeNet-5 是 LeCun 在 1998 年发明的卷积神经网络 ↗ ,其结构简单,很适合初学者用来学习卷积神经网络的构建方法。 来源 下面,我们将使用 TensorFlow 和 PyTorch 提供的低阶和高阶 API 来构建 LeNet-5 网络,总......

使用 Conda 管理 Python 开发环境

Conda 是非常好用的 Python 环境管理工具,目前使用最为广泛的发行版是 Anaconda。Anaconda 默认自带了大量科学计算和 Python 常用的第三方库,但体积不小。除此之外,Miniconda 的体积会小很多,但是自带的库也较少了......

线性回归最小二乘法与梯度下降法数学推导及 Python 实现

线性回归是一种十分基础的机器学习算法。但是基础并不意味着不重要,相反,基础往往才是最重要的。很多人入门机器学习,第一个学习的就是线性回归。例如,吴恩达的机器学习课程中......

LaunchBar 快速启动 Jupyter Notebook

由于个人和工作需要,每天都在和 Jupyter Notebook 打交道。很多时候,都需要在指定目录下方快速启动 Jupyter Notebook。于是,依托于 LaunchBar 提供的 Instant Send 功能,制作了一个快速启动 Jupyter Notebook 的 AppleScript 脚本。

人工神经网络数学推导及 Python 实现

人工神经网络是深度学习的基石,也是机器学习中一种十分重要的算法。与此同时,反向传播算法又是人工神经网络的核心。本文尝试通过数学矩阵完成神经网络的推导,并使用 Python 实现一......

深度学习环境配置和使用指南

最近更新:2019 年 5 月 16 日 对于深度学习环境而言,首先推荐大家使用一些优质的线上服务,而不是自行配置。下面,我们推荐两个提供免费 GPU 的在线 Notebook 服务。 免费 GPU 环境推荐 Kaggle Kernels Kaggle 被 Google 收购......

云主机上快速搭建 Jupyter Notebook 服务

Jupyter Notebook 是机器学习和数据分析领域经常会使用的的 Web IDE 工具,本地使用非常方便。那么,如果你想在自己的云主机 AWS, GCP 等上搭建 Jupyter Notebook,并支持远程访问,该如何做呢? 首先,非常建议大家在 AWS, GCP 等......