草根之明

管理及技术博客

0%

Sklearn (全称 Scikit-Learn) 是基于 Python 语言的机器学习工具。它建立在 NumPy, SciPy, Pandas 和 Matplotlib 之上,里面的 API 的设计非常好,所有对象的接口简单,很适合新手上路。

阅读全文 »

何为三要素

主动投资管理的先驱之一Richard Grinold写过一篇著名的文章,题为《α = Volatility × IC × Score》。这篇文章标题直白醒目,简明扼要的说明了在主动管理中寻求股票α收益率的三要素。

阅读全文 »

简介

移动平均(Moving Average,MA),又称移动平均线,简称均线。作为技术分析中一种分析时间序列的常用工具,常被应用于股票价格序列。移动平均可过滤高频噪声,反映出中长期低频趋势,辅助投资者做出投资判断。

阅读全文 »

字符串运算

字符串本质上也是一种元组,但是字符串有很多“运算”方式。最直观的是字符串的 + 和 * 运算,它们分别表示重复和连接。

阅读全文 »

遇见 Tablib

我们在 Python 实际开发过程中,经常涉及将数据导出为 Excel、Csv、Yaml、Json 等各种格式的文件的需求,一些粗鲁的实现方式是通过安装各种第三方模块以支持不同格式文件的导出操作。

阅读全文 »

重复元素判定

以下方法可以检查给定列表是不是存在重复元素,它会使用 set() 函数来移除所有重复元素。

阅读全文 »

MongoDB索引的类型

索引的概念

数据库索引是对数据库中一列或多列的值进行排序的一种数据结构,使用索引可以快速访问数据库表中的特定信息

阅读全文 »

train test split 训练数据集与测试数据集 切分

1
2
3
4
5
6
7
8
9
import numpy as np
from sklearn import datasets

# http://sklearn.lzjqsdd.com/modules/generated/sklearn.datasets.load_iris.html
# iris数据集(鸢尾花)
iris = datasets.load_iris()

X = iris.data
y = iris.target
阅读全文 »