SladeSha's Algorithm World

微信公众号:ml_trip


  • 首页

  • ME

  • 标签

  • 分类

  • 搜索

订单需求预估

发表于 2017-07-12 | 分类于 机器学习
字数统计: 1,555 字 | 阅读时长 ≈ 7 分钟
之前写了一篇以基于elastic的需求预估的文章,只不过用的是R语言开发的,最近在学python,就仿照逻辑写了一篇python的,主要修改点如下: 用决策树替换了elastic算法 用分层抽样替换了组合抽样 需要看详细理论及思考过程参考链接:商品需求预估 python code如下:12345 ...
阅读全文 »

推荐系统-威尔逊区间法

发表于 2017-06-21 | 分类于 算法
字数统计: 1,159 字 | 阅读时长 ≈ 4 分钟
我推荐一种之前在惠普做过一种排序方法:威尔逊区间法 我们先做如下设定: (1)每个用户的打分都是独立事件。 (2)用户只有两个选择,要么投喜欢’1’,要么投不喜欢’0’。 (3)如果总人数为n,其中喜欢的为k,那么喜欢的比例p就等于k/n。 这是一种统计分布,叫做”二项分布”(binomial di ...
阅读全文 »

协同过滤推荐

发表于 2017-06-21 | 分类于 机器学习
字数统计: 797 字 | 阅读时长 ≈ 4 分钟
set.seed ( 1234 ) 加载数据包library ( “recommenderlab” ) 构造数据运用recommenderlab包实现协同过滤推荐,其数据类型采用S4类构造,需通过as()函数转为raringMatrix类型。val1<- matrix ( sample ( c ...
阅读全文 »

聚类算法思路总结

发表于 2017-06-20 | 分类于 算法
字数统计: 1,754 字 | 阅读时长 ≈ 7 分钟
1.cost function 1.1 距离 常见的为欧式距离(L1 norm)&&p=2,拓展的可以有闵可夫斯基距离(L2 norm)&&p=1: 当p趋向于无穷的时候,切比雪夫距离(Chebyshev distance): 红色的时候为切比雪夫距离,蓝色为闵可夫斯 ...
阅读全文 »

常用R语言包介绍

发表于 2017-06-19 | 分类于 工具
字数统计: 887 字 | 阅读时长 ≈ 3 分钟
r与python差异比较大的一个地方就是,python的机器学习算法集中程度比较高,比如sklearn,就集成了很多的算法,而R语言更多时候需要一个包一个包去了解,比较费时费力,对于python转过来的朋友非常不友好,抽空整理了工作中常用的R包如下: 常用检验函数: 基本上分布中常见的都罗列了: 常 ...
阅读全文 »
1…101112
沙韬伟 sladesha

沙韬伟 sladesha

前滴滴出行风控算法负责人,前hp-Lab客户行为算法研究员

58 日志
8 分类
28 标签
知乎 简书 GitHub E-Mail Twitter
© 2019 沙韬伟 sladesha | Site words total count: 121.2k
本站访客数:
由 Hexo 强力驱动
|
主题 — NexT.Muse v5.1.3