圈子


关注微信公众号
关注微信公众号
原创 有道词典单词本导出并转化成EXCEL
今天想复习一下有道词典里面收藏的单词,结果只能导出.bin, .xml, .txt格式,但是我想把它放在excel里更容易操作排序、染色等,所以就提取了xml格式,然后用python转成了xlsx格式。具体代码如下: import xml.etree.ElementTree as ET import pandas as……


翻译 ML Q&A:机器学习在金融中如何应用?
机器学习在金融中如何应用? Quora平台的Afzal Ibrahim的回答,可以借鉴,转载和翻译如下。 原文链接:https://www.quora.com/How-is-machine-learning-used-in-finance 银行业是一个生态系统,它需要强大而高质量的智能,而不依赖与基于鬼则的编程(我们已……


原创 手把手带你抓取智联招聘的“数据分析师”岗位!
前言 很多网友在后台跟我留言,是否可以分享一些爬虫相关的文章,我便提供了我以前写过的爬虫文章的链接(如下链接所示),大家如果感兴趣的话也可以去看一看哦。在本文中,我将以智联招聘为例,分享一下如何抓取近5000条的数据分析岗信息。 往期爬虫链接 [上海历史天气和空气质量数据获取(Python版)](https://mp.……


原创 Python Tip:Jupyter notebook如何导出PDF文件?
> 问题背景:利用Jupyter notebook做好交互的数据分析或者模型后,想导出PDF文件作为简单版的报告或者交流的材料。如何从Jupyter notebook 导出PDF文件?并且对于有中文的情况,标题和正文都不含有乱码。 解决方案 以Window操作系统为例,具体解决步骤如下: 1 安装miktex 安装链接……


原创 用户画像系统的作业调度Airflow研究和应用
> 用户画像系统从业务入手,全面构建用户的标签体系。标签体系的设计和生成需要多个作业协同和有序工作。而用户画像系统的作业调度,就是用来保证多个作业能够协同有序工作。本文是对开源的作业调度系统Airflow的研究和应用探索。 Airflow环境配置 第一步:构建Linux开发环境 Windows操作系统基于虚拟机构建Li……


原创 1. Airflow 配置及使用 - 环境配置
AirFlow配置与使用 - 环境配置 注:本文为Linux下,Airflow使用的说明 Linux 环境为:CentOS 建议安装推荐的版本,避免不兼容的情况,如无特殊说明,以下命令均在命令行执行。 1.Linux系统 https://www.centos.org/download/ 配置环境 2.Python……


原创 【完结】棕榈学院Python课程回顾——K线图制作
【完结】棕榈学院Python课程回顾(Day 1-10) [TOC] > 棕榈学院的这个课程总体上来看还是相当不错的, 我花了很多的精力,也学习了很多的技巧,在这里整理一下。我之前学过的因为没有整理,导致之后要用的时候又找不到,所以还是很有必要的。 环境配置 ​ 在Python的编写之前,都会讲环境的搭建,我个人比……


翻译 Keras深度学习介绍
> 在本文中,我们将使用[Keras](https://keras.io/ "Keras")构建一个简单的神经网络。我们假设您对机器学习包(如[scikit-learn](http://scikit-learn.org/stable/ "scikit-learn"))和其他科学包(如[panda](https://pa……


翻译 在Tidyverse用estimatr
> estimatetr以稳健的标准差进行快速的OLS和IV回归。 本文揭示estimatetr如何与RStudio的tidyverse软件包集成。 获得整洁 tidyverse的第一步是将模型输出转换为我们可以操作的数据。 tidy函数将lm_robust对象转换为data.frame。 library(estima……


翻译 从头开始编写任何机器学习算法的6个步骤:感知器案例研究
> 从头开始编写机器学习算法是一种非常有益的学习体验。 我们在此过程中强调了6个步骤。 有些算法比其他算法更复杂,所以从一些简单的算法开始,从一些非常简单的算法开始,比如单层感知器。 我将以感知器为例,带您经历以下6步过程,从头开始编写算法: 对算法有一个基本的了解 找到一些不同的学习来源 将算法分解成块 从一个简……


翻译 学习R编程的好书籍
书籍,书籍,书籍 有很多书可以帮助你学习R编程。 但是,您如何知道选择哪本书来投入时间? 别担心。 这个简短的列表只有最好的R书,可以帮助你学习R编程。 开始了: R for Data Science 向大师学习! 向那些彻底改变我们如何编程的人学习。从高度定制的数据可视化到高效的数据处理,Hadley Wickham……


原创 随机森林算法
你好,你在本文中,可以看到这些内容: 随机森林是什么? 随机森林如何工作? 随机森林的优势 随机森林的应用 随机森林是什么? 随机森林是一种非参数的集成学习方法,森林里面的每一棵决策树是通过重采样训练数据集而生成的。与单一树对比,随机森林算法表现出更好的模型性能。 随机森林如何工作? > 随机森林如何工作? 要解……


转载 LaTeX新人教程,30分钟从完全陌生到基本入门
本教程面向对LaTeX完全无认知无基础的新人,旨在让新人能够用最简单快捷的方式,轻松入门,能够迅速使用LaTeX完成基本的文本编辑。 先用三句话来介绍什么是LaTeX,以下三点基于我个人的主观经验的总结。 1、LaTeX是一类用于编辑和排版的软件,用于生成PDF文档。 2、LaTeX编辑和排版的核心思想在于,通过se……


翻译 金融风险和它的类型
金融风险是跨领域和地区的每个企业的主要关注点之一。 这就是金融风险经理FRM考试赢得全球金融专家认可的原因。 FRM是为全球风险管理专业人士提供的最高凭证。 金融风险再次成为FRM 1级考试的基本概念。 在了解控制风险和执行风险管理的技术之前,了解风险是什么以及风险类型是非常重要的。 我们将在这篇文章中讨论不同类型的……


翻译 如何成为数据科学家:权威指南
> 数据科学教育家Jose Portilla提供了关于成为数据科学家的权威性指南,其中包括从获取特定技能到寻找第一份工作,再到掌握面试机会的各种资源。 你好!我是Jose Portilla,Udemy的讲师,有超过25万名学生注册了各种各样的课程,包括Python的数据科学和机器学习、R编程的数据科学、Python的大……


翻译 R中你应该学习7种可视化
> 数据可视化,让你的数据讲故事。 随着数据量的不断增加,如果没有可视化,就不可能讲故事。数据可视化是一门如何将数字转化为有用知识的艺术。 R编程通过提供一组用来构建可视化和表示数据的内置函数和库,让您学习这种艺术。在可视化技术实现之前,让我们先看看如何选择正确的图表类型。 选择正确的图表类型 有四种基本的表示类型:……