佩德罗·恩里克·罗查·梅
Verified Expert in Engineering
机器学习开发人员
Pedro是一位面向业务的经验丰富的数据科学家和数据工程师,具有大规模构建和部署生产分布式数据管道和机器学习模型的经验, 涵盖从设计开始的整个数据生命周期, construction, optimization, deployment, 以及数据架构和机器学习模型的监控. Pedro的重点是交付解决方案,这些解决方案对环境和数据的变化具有健壮性,并且能够灵活地应对业务需求的变化.
Portfolio
Experience
Availability
首选的环境
Python, Scala, 亚马逊网络服务(AWS), Data Engineering, Data Science, 机器学习, Big Data, 软件架构
最神奇的...
...我建立的系统是算法和概率交易系统. 由于对世界的看法有限,概率是风险管理的重要工具.
Work Experience
Chief Architect
Rocha Moy贸易公司
- 与Interactive Brokers和TD Ameritrade合作开发概率和算法期权交易API. 专长包括数据集成, task automation, 投资组合模拟, risk mitigation, 策略验证.
- 集成了许多不同的数据源,从api到网页抓取.
- 自动交易执行,交易调度,交易资金释放完全.
首席数据科学家
Self-employed
- 设计、实现和部署不同的自然语言处理模型.
- 与涉众一起工作以理解用例, 产品开发的途径, 以及使用已部署模型的实现.
- 指导和支持团队中的初级数据科学家.
企业首席数据架构师-承包商
Toptal Client
- 处理架构, development, 分布式计算管道的自动化和企业云中的数据存储.
- 云中的自动化可伸缩基础设施,以响应开发和用户需求.
- 共同管理和监督工程师团队的设计和委派任务, mentoring, 监督工作.
企业高级ETL和数据工程师-承包商
Toptal Client
- Designed, implemented, 并在Spark/Scala API中部署到生产中成熟的分布式ETL作业.
- 处理各种数据源和数据汇,包括绝望文件, Hive tables, Mongo集合, 和Kafka代理.
- 担任团队的高级工程师和技术主管,加强工程和开发流程, 改进软件质量控制, 并帮助设计sprint的故事.
Hadoop大气科学项目的概念证明-承包商
Toptal Client
- 从零开始构建集群,坚持客户端需要与家庭集群一起工作.
- 设计和实现通用和特定的数据架构,以满足客户端查询的复杂性和性能需求.
- 构建PySpark和Python软件抽象层,允许客户端在当前基础架构之上构建.
研究数据工程师
尼克劳斯儿童医院
- 为R用户开发现有的分析和数据工作流程, Python, 和英帕拉建立最佳工程实践.
- 提供临时和系统地开发ETL和大数据管道, validation, 以及不同数据源的集成.
- 为研究部门与IT和BI部门联系,就分析和数据需求提供指导和专业知识.
技术顾问
Insight数据科学
- 在问题定义方面与同事和他们的数据工程项目合作, 系统架构, and execution.
- 熟悉Spark、Kafka、Redis、HBase、Cassandra、PostgreSQL等技术.
- 就可伸缩性概念、算法和CS基础与同事进行模拟面试.
高级软件工程师
NexHealth
- 开发和部署软件到客户的站点,以执行数据收集和服务器同步.
- 将电子医疗记录与NexHealth服务器进行数据库和基于web的数据集成.
- 开发智能短信响应系统,允许用户通过短信与NexHealth产品互动.
Data Scientist
QuaEra Insights
- 在一个监督数据管理和建模策略的咨询项目中担任首席数据科学家.
- 利用自然语言处理将非结构化数据转换为特征,提取商业智能.
- 构建一个推荐引擎作为业务规则,可能会节省高达50%的业务成本.
数据工程研究员
Insight数据科学
- 建造了比赛中场管, 该平台旨在发现YouTube上对全球品牌有影响力的人.
- 部署Amazon的EMR Spark与HBase一起处理和摄取数十亿的数据元组.
- 在多达20个节点的测试中获得线性可伸缩性性能.
Data Analyst
Cartesian
- 辅助管理分析工作,促进批处理工作流和数据管理中的最佳实践.
- 独立研究大数据工作流,考虑数据挖掘和BI集成.
- 构建使用api的短数据管道, transforming, loading, 并向BI工具公开数据连接.
数据分析工程师
Daktari诊断
- 在Windows/Mac平台的Python中担任主流数据处理和数据分析应用程序的首席开发人员.
- 开发了Daktari CD4检测设备的校准模型,使系统精度提高了20-30%.
- 将部署的机器学习模型嵌入到独立应用程序中,以供最终用户进行数据分类.
Experience
持续边缘和套期保值股票交易策略
http://docs.google.com/presentation/d/1zkbfErfwbJvGBXFj9UWKDvq99wkj6EBvqniA4yFNu68/edit?usp=sharingEducation
工商管理高级工商管理硕士
迈阿密大学-迈阿密
计算机科学(机器学习)硕士学位
佐治亚理工学院-亚特兰大,乔治亚州
地球科学与工程(地球物理学)硕士学位
阿卜杜拉国王科技大学-沙特阿拉伯
机械工程学士学位
麻省大学洛厄尔分校
Skills
Libraries/APIs
微软HPC, PySpark, TensorFlow, PyTorch, Scikit-learn, XGBoost, Dask, SpaCy
Tools
ChatGPT, Amazon Elastic MapReduce (EMR), Spark SQL, JMP, Impala, Git, Gensim
Languages
Python, Julia, Scala, SQL, R, SAS, JavaScript, Bash, Snowflake
Storage
NoSQL, MongoDB, Oracle SQL, Microsoft SQL Server, Redis, Cassandra, PostgreSQL, HBase, Apache Hive, 数据集成
行业专业知识
Accounting
Paradigms
函数式编程,并行编程,分布式计算,数据科学
Platforms
Docker, Jupyter Notebook, Apache Kafka, Alteryx, Linux, 亚马逊网络服务(AWS)
Frameworks
Bootstrap, Ruby on Rails (RoR), Spark, Apache Spark, Flask, Hadoop, Streamlit
Other
机器学习, 分布式系统, OpenAI GPT-4 API, 金融建模, Web App UI, APIs, 数据架构, Data Modeling, DocumentDB, Dash, Deep Learning, 自然语言处理(NLP), Data Engineering, 人工智能(AI), Algorithms, 算法交易, Optimization, 强化学习, 时间序列分析, Forecasting, Cloud, 数值优化, 情绪分析, Neural Networks, Options Trading, Web Scraping, 概率论, Simulations, Finance, Law, Entrepreneurship, Leadership, Big Data, 软件架构, GPT, 生成预训练变压器(GPT), Data Analytics, 管理分析
如何使用Toptal
在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.
分享你的需求
选择你的才能
开始你的无风险人才试验
对顶尖人才的需求很大.
Start hiring