HANG ♥ WRITING

XGBoost 梯度提升算法入门

XGBoost 最早的雏形出现在 2014 年，当时由陈天奇读博期间负责的研究项目中。后经开源，逐渐发展成一个支持 C++，Java，Python，R 和 Julia 语言的成熟框架。XGBoost 是 Extreme Gradient Boosting 的缩写，其中的 Gradient Boosting 实际上就是梯度提升......

4467 字 · 3035 阅读

2020 年 03 月 10 日

在 Mac 中快速预览 Jupyter Notebook 文件

目前，Jupyter Notebook 已经成为数据科学的标配，许多机器学习工程师也会使用其快速构建模型。Jupyter Notebook 文件本身使用 JSON 存储，直接打开预览体验非常糟糕。所以，当你想要在 Mac 上快速编辑和预览 Notebook 默......

407 字 · 1806 阅读

2019 年 08 月 16 日

百度 Apollo 3.5 自动驾驶环境搭建指南

Apollo 是百度开源的自动驾驶开源平台，本篇文章主要用于说明 Apollo 环境搭建流程，并记录遇到的问题。本次环境搭建选择 AWS 提供的 c5n.2xlarge 云主机，配置为 8 vCPU 和 21GB MEM，无 GPU。系统选择 AWS 提供的 Ubuntu......

777 字 · 2794 阅读

2019 年 06 月 25 日

PyTorch 深度学习基础入门

PyTorch 基础语法 PyTorch 是 Facebook 主导开发的，基于 Python 的科学计算包，其主要有以下两个特点：比 NumPy 更灵活，可以使用 GPU 的强大计算能力。开源高效的深度学习研究平台。接下来，我们了解 PyTorch 的基础概念和......

5218 字 · 3103 阅读

2019 年 06 月 14 日

Jupyter Notebook 中文书写指南

Jupyter Notebook 是一款优秀的 Python 交互式编程工具，并十分适合用于数据分析和机器学习工作。本指南是我个人在使用 Jupyter Notebook 撰写技术文档时遵循的格式规范。基本规范首先，Jupyter Notebook 内容遵循基本中文......

655 字 · 3651 阅读

2019 年 05 月 19 日

Keras 中 LSTM 层两个重要参数理解

keras.layers.LSTM 类中有两个常用但不容易理解的参数，分别是 return_sequences 和 return_state。对于两个参数，官方定义如下： return_sequences: 布尔值。是返回输出序列中的最后一个输出，还是全部序列。 return_state: 布尔值。除了输出之外是否返......

740 字 · 8721 阅读

2019 年 05 月 15 日

机器学习和深度学习思维导图

分享我在机器学习实战课程中制作的知识点思维导图，涉及机器学习、深度学习、强化学习的内容。图片均为矢量图，可缩放页面查看大图。如果你有兴趣，欢迎报名线上课程（联系我可以获得特邀折扣券）。思维导......

221 字 · 2273 阅读

2019 年 05 月 10 日

Convolutional Neural Networks in TensorFlow 总结

Convolutional Neural Networks in TensorFlow 是 deeplearning.ai 的新课程，网上很多媒体会说是吴恩达的新课，实际上教学的老师是 Laurence Moroney。这门课课时不长，对于 TensorFlow 比较熟悉的人基本上只需要花费一上午的时间就能完整看完。事实上......

520 字 · 1203 阅读

2019 年 04 月 21 日

TensorFlow 2.0 构建神经网络

前面，我们以线性回归作为例子演示了 TensorFlow 2.0 的新变化和新特性。实际上，TensorFlow 等深度学习框架更重要的作用是用于构建人工神经网络。所以，本次实验将利用 TensorFlow 2.0 来构建一个简单的前......

2001 字 · 2269 阅读

2019 年 04 月 02 日

TensorFlow 2.0 实现线性回归

线性回归是机器学习中最简单的问题，同时线性回归也与人工神经网络有千丝万缕的关系。文章中，我们将以线性回归为例，使用 TensorFlow 2.0 提供的 API 来进行实现。与此同时，我们会使用 1.x......

2629 字 · 4172 阅读

2019 年 04 月 02 日

TensorFlow 2.0 新增变化特性

TensorFlow 2.0 版本现已推出，相对于 1.x 版本在很多地方都有较大的变动。文章中，我们将了解并学习 TensorFlow 2.0 的一些新的特征，同时熟悉一些常用的新 API 方法。前提条件：学习此课程的前提是已......

1827 字 · 2793 阅读

2019 年 04 月 02 日

Jupyter Notebook 中运行 Flask 应用

最近遇到一个奇怪的需求，就是要在 Jupyter Notebook 中使用 Flask。由于每一个 Jupyter Notebook 都独立运行在一个 Kernel 中，直接启动 Flask 变得不太可能。经过几次测试，最终使用子进程的方式完成了加载。首先，把示例 Flask......

307 字 · 6683 阅读

2019 年 03 月 27 日

SciPy 提供了封装好的最小二乘法函数 scipy.optimize.leastsq()。根据其官方文档显示的完整参数所示，使用该函数时需要传入 func 损失函数，x0 初始化参数以及通过 args=() 传入样本。 scipy.optimize.leastsq(func, x0, args=(), Dfun=None, full_output=0, col_deriv=0, ftol=1.49012e-08, xtol=1.49012e-08, gtol=0.0, maxfev=0, epsfcn......

428 字 · 2501 阅读

2019 年 03 月 22 日

机器学习常见术语表

整理常见机器学习术语，部分内容参考自 Machine Learning Glossary，你可以通过汉语拼音首字母快速检索。 C 超参数｜ Hyperparameter 在机器学习中，超参数是在开始学习过程之前设置值的参数，而不是通过训练得到的参数数据。通常情况下，需要对......

5017 字 · 1341 阅读

2019 年 03 月 14 日

Jupyter Notebook 使用小技巧

下面，列举一些 Notebook 中的使用小技巧。快捷键 shift + 回车 → 运行单元格（当 Markdown 单元格处于编辑状态时，运行即可复原） X → 剪切单元格 C → 复制单元格 V → 粘贴单元格连续按 D D → 删除单元格（慎用......

341 字 · 2811 阅读

2019 年 02 月 27 日

使用 DCGAN 生成动漫小姐姐头像

生成对抗网络是 2014 年由伊恩·古德费洛等人提出的一种非监督式学习方法 arXiv:1406.2661v1，该方法的特点是通过让两个神经网络相互博弈的方式进行学习。DCGAN 是 GAN 的一种十分实用的延伸网络，它由......

1049 字 · 1964 阅读

2019 年 02 月 22 日

LeNet-5 卷积神经网络的 4 种实现方法

LeNet-5 是 LeCun 在 1998 年发明的卷积神经网络 ↗ ，其结构简单，很适合初学者用来学习卷积神经网络的构建方法。来源下面，我们将使用 TensorFlow 和 PyTorch 提供的低阶和高阶 API 来构建 LeNet-5 网络，总......

1346 字 · 2718 阅读

2019 年 02 月 19 日

使用 Conda 管理 Python 开发环境

Conda 是非常好用的 Python 环境管理工具，目前使用最为广泛的发行版是 Anaconda。Anaconda 默认自带了大量科学计算和 Python 常用的第三方库，但体积不小。除此之外，Miniconda 的体积会小很多，但是自带的库也较少了......

534 字 · 1979 阅读

2019 年 01 月 26 日

线性回归最小二乘法与梯度下降法数学推导及 Python 实现

线性回归是一种十分基础的机器学习算法。但是基础并不意味着不重要，相反，基础往往才是最重要的。很多人入门机器学习，第一个学习的就是线性回归。例如，吴恩达的机器学习课程中......

2116 字 · 4086 阅读

2018 年 10 月 10 日

LaunchBar 快速启动 Jupyter Notebook

由于个人和工作需要，每天都在和 Jupyter Notebook 打交道。很多时候，都需要在指定目录下方快速启动 Jupyter Notebook。于是，依托于 LaunchBar 提供的 Instant Send 功能，制作了一个快速启动 Jupyter Notebook 的 AppleScript 脚本。

193 字 · 1513 阅读

2018 年 09 月 30 日

人工神经网络数学推导及 Python 实现

人工神经网络是深度学习的基石，也是机器学习中一种十分重要的算法。与此同时，反向传播算法又是人工神经网络的核心。本文尝试通过数学矩阵完成神经网络的推导，并使用 Python 实现一......

1496 字 · 2218 阅读

2018 年 08 月 19 日

深度学习环境配置和使用指南

最近更新：2019 年 5 月 16 日对于深度学习环境而言，首先推荐大家使用一些优质的线上服务，而不是自行配置。下面，我们推荐两个提供免费 GPU 的在线 Notebook 服务。免费 GPU 环境推荐 Kaggle Kernels Kaggle 被 Google 收购......

1554 字 · 2434 阅读

2018 年 07 月 25 日

云主机上快速搭建 Jupyter Notebook 服务

Jupyter Notebook 是机器学习和数据分析领域经常会使用的的 Web IDE 工具，本地使用非常方便。那么，如果你想在自己的云主机 AWS, GCP 等上搭建 Jupyter Notebook，并支持远程访问，该如何做呢？首先，非常建议大家在 AWS, GCP 等......

1347 字 · 2552 阅读

2018 年 07 月 12 日