简单的经历

Hey,你好!

我叫沙韬伟,英文名是SladeSha五年的机器学习及深度学习相关的工作经验,数学与应用数学本科毕业,喜欢和大家分享知识(传送门:知乎简书Github)。目前就职于一家公路物流互联网企业运满满,负责自然语言处理、定价预估、推荐方向。

一些实践:

  • CRM,实现过Facebook的GBDT+LR、阿里的MLR、Google的Wide&Deep并在滴滴出行用户的流失预估,行为偏好预估;苏宁的订单预估,流失预估,行为偏好预估;Yoho的订单预估、品牌预估、品类预估、流失预估应用过;用dbscan进行滴滴出行”家庭地址”识别;应用DeepFm在运满满做用户潜在流失风险预估,激活挽回概率预估;
  • 风控,滴滴租车线上线下风控算法设计者;负责yoho!buy基于谱聚类下的黑名单复杂网络识别;开源了实时撞库的风控算法Frcwp,现在被应用于滴滴、Yoho!Buy的撞库拦截中;yoho!buy用户信用分体系打分卡算法设计;滴滴用户曼哈顿信用分算法团队成员;
  • 推荐,在yoho实现了Google的Deep Neural Networks for YouTube Recommendations并用于列表页召回;在苏宁主导了基于Item2vec推荐召回系统;利用热传导、物质扩散算法用于召回集的新增,威尔逊排序进行商品排序;应用Session-based Recommendations with Recurrent Neural Networks优化当前已有的传统推荐算法DeepFm生成召回集,同时测试常见的attention机制(google系、阿里系、山东大学系方法)在Ctr预估上的效果;在运满满的论坛详情页帖子推荐上应用了ELMo+GloVe的向量化拼接做为排序基础词向量;
  • 自然语言,在运满满负责了智能问答机器人的研发,协助语音发货,语音找货的功能点开发;同时,负责了运满满货主论坛的黄色/反动/广告内容识别项目,主导了运满满货主论坛的详情页帖子内容推荐的项目;建立了货运行业独有的热词词库

    除此以外:

    • 对一些基础理论懂一些,能够形象化的让人理解算法内容,便于和老大、团队沟通
    • 了解图像一些基础概念,曾在闲暇时间,利用自己的ml知识给这些方向的大佬打杂过
    • 懂一些包括Abtest、漏斗分析、流失分析、渠道分析、决策推演等,认为数据质量才是工程的核心,对数据特征构造有自己不成熟的总结
    • 懂一些基础算法在CTR预估上的应用,正在逐个实现Github实现地址

工程能力:

  • 大学写过3年多的R/distributedR,毕业之后用了3年python,2年tensorflow,最近在鼓捣java,了解Linux常用命令
  • 用过teredata,oracle,vertica,Hive,mysql等,写过4年hive/sql脚本,获取数据并做些基础分析没什么问题
  • 用过apache zeppelin,tableau等数据可视化工具 ,被强迫用过scala写过1年zeppelin
  • 用过hadoop,spark等开源平台,接触过PyTorch、caffe深度学习框架,写过一些sparkSteaming的流处理任务
  • 比较常会直接使用一些比如Kafka、Redis、rabbitMq、rocketMq等的中间件
  • Python服务之前一直在用Tornado,python接口实际开发过一些项目

基础能力::

  • 树类算法:randomforest、gbdt、xgboost、Isolation forest等都上手用过
  • 线性算法:logistic、lasso、fm、ffm、mixed logistic regression、elastic net等都有些总结
  • 聚类算法:lof、dbscan、kmeans、clarans、谱聚类、infomap、MLC、t-SNE等都看过
  • 神经网络:FNN、CNN、NFM、AFM,DeepFM、Wide&Deep、DCN等都自己写过
  • 文本处理:Word2Vec,GloVe,ELMo,GRU,LSTM等都有一些实际使用经验
  • 其他: SVM、Word2vec、Doc2vec、Smote、协同过滤、N-gram、bandit、RBM等都能说上几句

还行的东西:

  • 从无到有,lead了风滴滴控安全云平台策略框架,对风控损失负责,设计的风控算法,监控体系,一年内无一次车辆风险(行业7‰)
  • 从有到精,lead了数据超市的项目,优化算法后的商品ROI是原来的6倍,荣获苏宁互联网创新奖;lead的”苏宁营销金矿”中的用户家庭地址识别,荣获苏宁突出贡献奖
  • 参加了滴滴学院的分享,季度夜校分享冠军,协助滴滴完成最基础的路径规划中地址识别的算法,滴滴曼哈顿分算法成员,评估过腾讯安全盾、阿里Rain分芝麻信用分、同盾分、万达名单等近10家用户风控的第三方数据源
  • 滴滴极致执行奖、滴滴最佳进步奖、滴滴夜校最佳分享、电信年度优秀实习生,数据学院特邀讲师
  • 预测yoho!buy的用户品牌偏好的准确率是原运营baseline的3倍,在yoho!buy主导的Deep Neural Networks for YouTube Recommendations的ctr预估根据线上的abtest的反馈优于原deepfm准确率2.0pp
  • 运满满荣誉讲师,从0到1建立了运满满南京算法团队,主导了论坛敏感内容识别、论坛详情页推荐、语音发货、客服问答机器人等项目;同时对接评估了腾讯云、阿里云的NLP鉴黄、图像产品,完成多次与云问科技、中信通研究院等交流分享

更多的技术能力可以在我的bolg和我的github里面查看,时间跨度较久,很多最开始写的东西不免存在不成熟的地方,希望大家批评指导;14年开始在电信、惠普共实习了近一年半的时间;之后在滴滴工作了近两年,有货电商工作了1年多的时间,一直从事的都是风控、推荐、Crm、nlp方向,也很喜欢做这些事情,且有得有失,欢迎stw386@sina.com联系我闲聊~

ps1:南京的朋友可以约我出来喝下午茶,一起吹吹牛
ps2:死磕南京,再好的机会也不离开南京- -