不是特别严肃的介绍

Hey,你好!

我叫沙韬伟,英文名是SladeSha四年的机器学习及深度学习相关的工作经验,数学与应用数学本科毕业,喜欢和大家分享知识(传送门:知乎简书Github)。

总结一下自己,我是一个喜欢做crm,但是毕业误入了风控,后因公司缺人填坑推荐,现被逼做NLP的苦逼的算法工程师,所以别问我为什么涉及过这么多项目,人在江湖,身不由己啊~

微不足道的实践:

  • CRM,实现过Facebook的GBDT+LR、阿里的MLR、Google的Wide&Deep并在滴滴出行用户的流失预估,行为偏好预估;苏宁的订单预估,流失预估,行为偏好预估;Yoho的订单预估、品牌预估、品类预估、流失预估应用过;用dbscan进行滴滴出行”家庭地址”识别;
  • 风控,滴滴租车线上线下风控算法设计者;负责yoho!buy基于谱聚类下的黑名单复杂网络识别;开源了实时撞库的风控算法Frcwp,现在被应用于滴滴、Yoho!Buy的撞库拦截中;yoho!buy用户信用分体系打分卡算法设计;滴滴用户曼哈顿信用分算法团队成员;
  • 推荐,在yoho实现了Google的Deep Neural Networks for YouTube Recommendations并用于列表页召回;在苏宁主导了基于Item2vec推荐召回系统;利用热传导、物质扩散算法用于召回集的新增,威尔逊排序进行商品排序;应用Session-based Recommendations with Recurrent Neural Networks优化当前已有的传统推荐算法DeepFm生成召回集,同时测试常见的attention机制(google系、阿里系、山东大学系方法)在Ctr预估上的效果

    除此以外:

    • 对一些基础理论懂一些,能够形象化的让人理解算法内容,便于和老大、团队沟通
    • 图像和文本了解一些基础概念,曾在闲暇时间(晚上加班的时间),利用自己的ml知识给这些方向的大佬打杂过
    • 懂一些包括Abtest、漏斗分析、流失分析、渠道分析、决策推演等,认为数据质量才是工程的核心,对数据特征构造有自己不成熟的总结
    • 懂一些基础算法在CTR预估上的应用,正在逐个实现Github实现地址

凑合的工程能力:

  • 写过2年R/distributedR,3年python,用过1年tensorflow,了解Linux常用命令
  • 用过teredata,oracle,vertica,Hive,mysql等,写过4年hive/sql脚本
  • 用过apache zeppelin,tableau等数据可视化工具 ,被强迫用过scala写过1年zeppelin
  • 用过hadoop,spark等开源平台,接触过tensorflow、caffe深度学习框架

不成熟的总结::

  • 树类算法:randomforest、gbdt、xgboost、Isolation forest等都上手用过
  • 线性算法:logistic、lasso、fm、ffm、mixed logistic regression、elastic net等都有些总结
  • 聚类算法:lof、dbscan、kmeans、clarans、谱聚类、infomap、MLC、t-SNE等都看过
  • 神经网络:FNN、CNN、GRU、LSTM、NFM、AFM,DeepFM、Wide&Deep、DCN等都自己写过
  • 其他: SVM、Word2vec、Doc2vec、Smote、协同过滤、N-gram、bandit、RBM等都能说上几句

还行的东西:

  • 从无到有,lead了风滴滴控安全云平台策略框架,对风控损失负责,设计的风控算法,监控体系,一年内无一次车辆风险(行业7‰)
  • 从有到精,lead了数据超市的项目,优化算法后的商品ROI是原来的6倍,荣获苏宁互联网创新奖;lead的”苏宁营销金矿”中的用户家庭地址识别,荣获苏宁突出贡献奖
  • 参加了滴滴学院的分享,季度夜校分享冠军,协助滴滴完成最基础的路径规划中地址识别的算法,滴滴曼哈顿分算法成员,评估过腾讯安全盾、阿里Rain分芝麻信用分、同盾分、万达名单等近10家用户风控的第三方数据源
  • 滴滴极致执行奖、滴滴最佳进步奖、滴滴夜校最佳分享、电信年度优秀实习生,数据学院特邀讲师
  • 预测yoho!buy的用户品牌偏好的准确率是原运营baseline的3倍,在yoho!buy主导的Deep Neural Networks for YouTube Recommendations的ctr预估根据线上的abtest的反馈优于原deepfm准确率2.0pp

我喜欢尝试新鲜的技术,喜欢不断总结,以自己为自己的标杆,呆过电信、惠普实习;滴滴、苏宁、yoho工作。俄罗斯方块玩的还行,ppt做的还可以。一直从事的都是风控、推荐、Crm方向,也很喜欢做这些事情,且有得有失,欢迎stw386@sina.com联系我闲聊~