Airflow【实践 01】Airflow官网+自测源代码举例(简化安装+官方及自测python代码)

2 篇文章 0 订阅
订阅专栏
本文详细介绍了如何在ApacheAirflow2.7.2中进行安装,包括设置安装目录、创建虚拟环境并安装Airflow,以及如何查询DAG目录。还提供了官方示例和自测案例,展示了如何使用BashOperator和配置任务依赖。
摘要由CSDN通过智能技术生成


官方网站地址: https://airflow.apache.org/docs/apache-airflow/2.7.2/,本文是基于 2.7.2版本进行的说明。

1.准备

1.1 安装

上一篇的 Quick Start 有详细的安装过程,这里做最简安装启动:

# 1.设置安装目录
export AIRFLOW_HOME=~/airflow

# 2.创建虚拟环境并安装
# 创建并切换到airflow虚拟环境
conda create -n airflow python=3.8
conda activate airflow
pip install "apache-airflow==2.7.2"

# 3.前台启动【在虚拟环境下】
airflow standalone

1.2 查询DAG目录

  1. dags_folder目录将Python文件放置到
[root@tcloud airflow]# cat airflow.cfg | grep dags_folder
dags_folder = /root/airflow/dags

2.官方

  1. 安装任务所需的依赖【代码执行所需要的依赖】
conda install scikit-learn
  1. 官方举例文件demo.py放置到dags_folder路径下

文件内容如下:

from datetime import datetime

from airflow import DAG
from airflow.decorators import task
from airflow.operators.bash import BashOperator

# A DAG represents a workflow, a collection of tasks
with DAG(dag_id="demo", start_date=datetime(2022, 1, 1), schedule="0 0 * * *") as dag:

    # Tasks are represented as operators
    hello = BashOperator(task_id="hello", bash_command="echo hello")

    @task()
    def airflow():
        print("airflow")

    # Set dependencies between tasks
    hello >> airflow()
  1. 刷新页面即可看到DAG,点击即可执行,效果如下:

demo.jpg

3.自测

  1. 创建测试文件airflow_test.py并放置到dags_folder目录下

文件内容如下:

from datetime import timedelta
from airflow import DAG
from airflow.operators.bash_operator import BashOperator
from airflow.utils.dates import days_ago

# DAG属性定义
default_args = {
    'owner': 'airFlowTest',
    'depends_on_past': False,
    'start_date': days_ago(31),
    # 填入邮箱,方便失败、重试时发送邮件
    'email': ['xxxxx@qq.com'],
    # 失败时发邮件告警
    'email_on_failure': True,
    'email_on_retry': False,
    # 重试次数
    'retries': 1,
    'retry_delay': timedelta(minutes=2),
    # 'queue': 'bash_queue',
    # 'pool': 'backfill',
    # 'priority_weight': 10,
    # 'end_date': datetime(2016, 1, 1),bu
    # 'wait_for_downstream': False,
    # 'dag': dag,
    # 'sla': timedelta(hours=2),
    # 'execution_timeout': timedelta(seconds=300),
    # 'on_failure_callback': some_function,
    # 'on_success_callback': some_other_function,
    # 'on_retry_callback': another_function,
    # 'sla_miss_callback': yet_another_function,
    'trigger_rule': 'all_success'
}

# 定义dag
dag = DAG(
    'air_test',
    default_args=default_args,
    description='A simple airflow test',
    schedule_interval=timedelta(days=1),
)

step_one = BashOperator(
    task_id='step_one',
    bash_command='echo step_one over! >> /root/airflow/file/airflowtest.log',
    dag=dag,
)

step_two = BashOperator(
    task_id='step_two',
    depends_on_past=False,
    bash_command='echo step_two over! >> /root/airflow/file/airflowtest.log',
    retries=3,
    dag=dag,
)

step_three = BashOperator(
    task_id='step_three',
    depends_on_past=False,
    bash_command='echo step_three over! >> /root/airflow/file/airflowtest.log',
    retries=3,
    dag=dag,
)

step_four = BashOperator(
    task_id='step_four',
    depends_on_past=False,
    bash_command='echo step_four over! >> /root/airflow/file/airflowtest.log',
    retries=3,
    dag=dag,
)

step_one >> step_two >> step_four
  1. 执行结果
[root@tcloud file]# pwd
/root/airflow/file

[root@tcloud file]# cat airflowtest.log
step_one over!
step_three over!
step_two over!
step_four over!

执行结果说明:step_one和step_three是同时开始执行的,step_one、tep_two、step_four是按顺序执行的。

4.总结

  • 使用bash_command的可操作空间就比较大了
  • airflow的语法需要进行学习
批处理 原理与代码实例讲解
程序员光剑
06-18 941
批处理 原理与代码实例讲解 1.背景介绍 批处理(Batch Processing)是指将大量数据或任务作为一个批次进行处理,而不是一次处理一个。这种处理方式可以提高系统的效率和吞吐量,因为它可以最大限度地利用计算机资源,减少了频繁启动和终止进程所带来的开销。 批处理广泛应用于各种领
Oozie工作流调度系统原理与代码实例讲解
程序员光剑
07-23 780
Oozie工作流调度系统原理与代码实例讲解 作者:禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 1. 背景介绍 1.1 问题的由来 随着大数据技术的发展,数据
Airflow 中文文档:快速开始
龙哥盟
11-28 3万+
安装快速而直接。 # airflow needs a home, ~/airflow is the default, # but you can lay foundation somewhere else if you prefer # (optional) export AIRFLOW_HOME = ~/airflow # install from pypi using pip pip in...
Airflow Python工作流引擎的重要概念介绍
热门推荐
watermelonbig的专栏
09-10 4万+
1、Airflow简介 Airflow是一个以编程方式创作,安排和监控工作流程的平台。 当工作流被定义为代码时,它们变得更易于维护,可版本化,可测试和协作。 使用Airflow工作流作为任务的有向非循环图(DAG)。 Airflow调度程序在遵循指定的依赖项的同时在一组worker上执行您的任务。 丰富的命令行实用程序可以轻松地在DAG上执行复杂的手术。 丰富的用户界面使您可以轻松地可视化...
airflow安装部署(python)
大数据创新开发者、大数据技术开发、创新性大数据分享
05-24 3909
在线安装Airflow 组件版本: Python 3.7.2 Apache airflow 1.10.1 Mysql 5.7.24 CentOs7.8 Python安装 Centos7中,Python默认是安装的,输入python 直接可以查看版本号,入下图 注意: 如果本机安装python2,尽量不要管它,使用python3运行python脚本就好,因为可能有程序依赖目前的python2环境, 比如yum!不要动现有的python2环境! 安装python3依赖 命令: .
airflow 入门示例
程序认生
02-03 1351
目录 导入模块 设置默认参数 实例化一个DAG 任务 Templating with Jinja 设置依赖关系 简要重述以上内容 测试 导入模块 # 导入所需的模块 # DAG用来实例化DAG对象,注意仅仅只是定义了一个对象,而不是进行真正的数据处理流程 from airflow import DAG from airflow.operators.bash_operator i...
Airflow 实战:安装配置和代码示例
程序员光剑
09-19 3304
数据中心是技术部的一个独立团队,承担了包括数据开发、数据平台建设、数据仓库建设、数据应用支撑等工作。作为一个运营商级的数据平台服务公司,通过构建面向分析师和数据科学家的大数据分析工具平台、完善的产品体系和数据治理机制,结合数据的价值驱动,提升业务决策效率,助力美团和相关机构取得更高的收益。随着公司业务的不断扩张、用户的增长、新型互联网场景的出现,需要大量的数据处理、分析、存储,同时还要保证数据的准确性、完整性和可靠性。因此,本文将对美团点评数据中心的数据仓库系统——Airflow进行全面的分析和介绍。
Airflow 实践笔记-从入门到精通一
Focus on Lakehouse
05-31 958
数据处理逻辑多,脚本相互依赖强,运维管理监测难,怎么办?!为了解决这些问题,最近比较深入研究Airflow的使用方法,重点参考了官方文档和Data Pipelines with Apache Airflow,特此笔记,跟大家分享共勉。Airflow项目2014年在Airbnb的Maxime Beauchemin开始研发airflow,经过5年的开源发展,airflow在2...
有了这个网络安全面试题,面试就像开了挂!(附PDF)
lvaolan的博客
02-26 931
还有兄弟不知道网络安全面试可以提前刷题吗?费时一周整理的160+网络安全面试题,金九银十,做网络安全面试里的显眼包!王岚嵚工程师面试题(附答案),只能帮兄弟们到这儿了!如果你能答对70%,找一个安全工作,问题不大。对于有1-3年工作经验,想要跳槽的朋友来说,也是很好的温习资料!【完整版领取方式在文末!!​​​​内容实在太多,不一一截图了。
Airflow实践 01Airflow官网+自测源代码举例简化安装+官方自测python代码
2301_77033672的博客
04-26 490
demo.py。
Oozie原理与代码实例讲解
最新发布
程序员光剑
08-08 646
Oozie原理与代码实例讲解 1.背景介绍 在大数据时代,数据处理工作流程日益复杂,手动调度和管理任务变得越来越困难。Apache Oozie应运而生,作为一个工作流调度系统,它能够有效管理大数据作业的执行。Oozie可以集成多种大数据工具,如Hadoop MapReduce、Spark、Hiv
数据仓库与数据湖原理与代码实战案例讲解
程序员光剑
08-04 896
数据仓库与数据湖原理与代码实战案例讲解 1. 背景介绍 1.1 数据的重要性 在当今的数字时代,数据被视为新的"燃料",推动着各行各业的创新和发展。无论是电子商务、金融服务、制造业还是医疗保健,海量的数据不断产生和累
20170724 Airflow官网资料学习
weixin_30367169的博客
07-24 56
-- 1 Apache Airflow 文档 AirFlow 对编程人员来讲就是一个平台,用于进行日程安排和监控。但是还在卵化期,严格来说,不是一个完整的成品。 转载于:https://www.cnblogs.com/Soar-Pang/p/7227266.html...
python airflow_Airflow使用经验分享
weixin_39955732的博客
12-05 1664
一、Airflow简介Airflow是一个编排、调度和监控workflow的平台。Airflow的核心概念有五个:DAGs:即有向无环图(Directed Acyclic Graph),将所有需要运行的tasks按照依赖关系组织起来,描述的是所有tasks执行的顺序。Operators:可以简单理解为一个class,描述了DAG中一个具体的task具体要做的事。其中,airflow内置了很多ope...
airflow第一个实例
weixin_34130389的博客
07-30 421
2019独角兽企业重金招聘Python工程师标准>>> ...
python airflow_airflow 安装,部署,填坑
weixin_39918928的博客
12-05 545
阅读本文大约需要 8 分钟。上一篇文章已经介绍过 airflow ,相信需要的人早已上网搜索相关资料,已经开始动手干了,没错,就是干,喜欢一件事件,请立即付诸行动,不要拖,时间一长,就凉了。Python 的包管理工具 pip 是一个非常优秀的工具,Python 相关的库都可以使用 pip 安装airflow 也不例外。废话不多说,直接上操作步骤。截止目前 2018年8月14日 ,airflow ...
介绍一个Python的有向无环图任务编排库:Airflow
明飞的博客
12-06 744
创建类来表示任务节点和有向边,每个任务节点可能包含任务的具体逻辑、依赖关系、输入输出等信息。创建任务节点,添加到DAG中,并定义任务之间的依赖关系。# DAG结构:# A# / \# B CApache Airflow是一个开源的、分布式的任务调度工作流编排平台,旨在简化和规范数据处理任务管理。其核心概念是DAG(有向无环图),这是一种表示任务之间依赖关系的方式。
airflow部署和使用示例
全栈工程师开发手册(原创)https://github.com/tencentmusic/cube-studio
01-08 2020
参考:https://www.jianshu.com/p/089c56b4ec14
python airflow_airflow 实战总结
weixin_39901077的博客
12-05 747
airflow 介绍airflow是一款开源的,分布式任务调度框架,它将一个具有上下级依赖关系的工作流,组装成一个有向无环图。特点:分布式任务调度:允许一个工作流的task在多台worker上同时执行可构建任务依赖:以有向无环图的方式构建任务依赖关系task原子性:工作流上每个task都是原子可重试的,一个工作流某个环节的task失败可自动或手动进行重试,不必从头开始任务工作流示意图一个dag表示...
写文章

热门文章

  • Flume【问题记录 01】【at org.apache.flume.node.Application.main(Application.java:xxx) 类问题整理+其他类型问题总结】【避坑指南】 12308
  • Kafka【付诸实践 03】Offset Explorer Kafka 的终极 UI 工具安装+简单上手+关键特性测试(一篇学会使用 Offset Explorer) 7012
  • Kafka【问题 02】KafkaTemplate 报错 Bootstrap broker localhost:9092 (id: -1 rack: null) disconnected 问题解决 6030
  • Azkaban【环境搭建 02】CentOS release 7.5安装配置azkaban-3.70.0安装阶段(含已编译的10个安装文件:可直接进行安装) 4862
  • Druid【基础 01】是什么+主要特点+设计原则+架构+数据结构(简单入门Druid) 4617

分类专栏

  • ::: :: : Kettle : :: ::: 付费 10篇
  • ::: :: : Hadoop : :: ::: 付费 14篇
  • ::: :: : Hive : :: ::: 付费 8篇
  • ::: :: : Sqoop : :: ::: 付费 3篇
  • ::: :: : 内容说明 : :: ::: 5篇
  • ::: :: : AI : :: ::: 1篇
  • ::: :: : Big Data : :: ::: 15篇
  • ::: :: : HBase : :: ::: 2篇
  • ::: :: : AirFlow : :: ::: 2篇
  • DolphinScheduler 1篇
  • :: ::: :: : Nifi : :: ::: :: 1篇
  • ::: :: : Flume : :: ::: 7篇
  • ::: :: : Flink : :: ::: 2篇
  • Presto 3篇
  • ::: :: : Spark : :: ::: 5篇
  • InfluxData 2篇
  • Elasticsearch 6篇
  • Greenplum 2篇
  • ::: :: : Kafka : :: ::: 11篇
  • Azkaban 3篇
  • ZooKeeper 8篇
  • Ganglia 2篇
  • Druid 3篇
  • Zeppelin 2篇
  • Superset 4篇
  • Grafana 1篇
  • Pinpoint 2篇

最新评论

  • DolphinScheduler【部署 01】分布式可视化工作流任务调度工具DolphinScheduler部署使用实例分享(一篇入门学会使用DolphinScheduler)

    シ風: 我就是用的内存数据库H2,是不是新版本不稳定,或者部署环境导致的。

  • DolphinScheduler【部署 01】分布式可视化工作流任务调度工具DolphinScheduler部署使用实例分享(一篇入门学会使用DolphinScheduler)

    尐霁: 官方文档上写得有问题,单机模式部署,他说有一个内存数据库可以使用,直接启动他的sh文件即可,后面发现如果按照他的做法,就好出现这种情况,必须要配置数据库初始化表结构之后才能启动成功。

  • DolphinScheduler【部署 01】分布式可视化工作流任务调度工具DolphinScheduler部署使用实例分享(一篇入门学会使用DolphinScheduler)

    シ風: 可以先看看日志信息

  • DolphinScheduler【部署 01】分布式可视化工作流任务调度工具DolphinScheduler部署使用实例分享(一篇入门学会使用DolphinScheduler)

    尐霁: 单机模式启动30秒左右查询状态就显示停止了,这个该如何解决呢

  • DolphinScheduler【部署 01】分布式可视化工作流任务调度工具DolphinScheduler部署使用实例分享(一篇入门学会使用DolphinScheduler)

    CSDN-Ada助手: 不知道 云原生入门 技能树是否可以帮到你:https://edu.csdn.net/skill/cloud_native?utm_source=AI_act_cloud_native

最新文章

  • AI【基础 01】神经网络基础知识(不断进行补充整理)
  • DolphinScheduler【部署 01】分布式可视化工作流任务调度工具DolphinScheduler部署使用实例分享(一篇入门学会使用DolphinScheduler)
  • Airflow【部署 01】Airflow官网Quick Start实操(一篇学会部署Airflow)
2024年4篇
2023年2篇
2022年18篇
2021年84篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

シ風

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或 充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家南阳肖像玻璃钢人物雕塑公司商场中庭美陈分哪些类趣味人文玻璃钢雕塑人物白银仿真人物玻璃钢雕塑设计江苏小品系列玻璃钢雕塑上海玻璃钢雕塑制作厂奥特曼玻璃钢雕塑长春市玻璃钢雕塑定制厂家淄博玻璃钢雕塑厂家供应广州卡通玻璃钢雕塑生产玻璃钢雕塑厂家价格长乐玻璃钢座椅雕塑动物大象玻璃钢雕塑和龙玻璃钢头像雕塑广州玻璃钢雕塑品牌十月一商场美陈布置上海广场玻璃钢雕塑价格玻璃钢泡沫雕塑多少钱抽象人物玻璃钢雕塑公司玉林市玻璃钢雕塑定制菏泽不锈钢仿古玻璃钢雕塑北京户外商场美陈供应商弥勒市玻璃钢雕塑厂家门头沟商场美陈装饰方案乐山玻璃钢仿铜雕塑定制供应发光动物玻璃钢雕塑定做泸州商场美陈花器深圳玻璃钢卡通人物雕塑潍坊洛阳玻璃钢卡通雕塑泡沫雕塑815玻璃钢油漆香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化