配置spark历史服务(spark二)

1. 编辑spark-defaults.conf位置文件

添加spark.eventLog.enabled和spark.eventLog.dir的配置
修改spark.eventLog.dir为我们之前在hdfs配置的端口
hdfs配置参考hadoop(七)集群配置同步（hadoop完全分布式四）|9

[shaozhiqi@hadoop102 conf]$ pwd
/opt/module/spark-2.4.3-bin-hadoop2.7/conf [shaozhiqi@hadoop102 conf]$ vim spark-defaults.conf # spark.master spark://master:7077 # spark.eventLog.enabled true # spark.eventLog.dir hdfs://namenode:8021/directory # spark.serializer org.apache.spark.serializer.KryoSerializer # spark.driver.memory 5g # spark.executor.extraJavaOptions -XX:+PrintGCDetails -Dkey=value -Dnumbers="one two three" spark.eventLog.enabled true spark.eventLog.dir hdfs://hadoop102:9000/directory

2. 分发我们conf修改的配置文件

分发配置参考hadoop(六)rsync远程同步|xsync集群分发(完全分布式准备三)|8

找个机器看下是否同步成功

3. 启动我们的hdfs

防止启动报错，先删除data logs 然后格式化namenode
bin/hdfs namenode –format

启动成功，查看进程

Yarn等我们提交任务到yarn时再启动

4. 查看我们的hdfs namenode ui

image.png

5. 创建hdfs文件夹，和我们上面配置的spark-defaults.conf中的一样

再次查看：

image.png

6. 再次修改spark-env.sh添加历史服务参数

[shaozhiqi@hadoop102 conf]$ vi spark-env.sh
export JAVA_HOME=/opt/module/jdk1

7. 同步我们的spark-env.sh

8. 执行一个spark进程

9. 查看spark ui多了我们的进程

image.png

点击spark pi进程，由于我们的任务还在执行，可以直接跳转

image.png

10. 发现好久都没有执行完看下日志

难道是没有资源了？
点击kill掉spark shell和我们的spark Pi,然后单独提交spark Pi任务试下

image.png

可以看到50多秒句结束了
当任务执行结束现在去访问spark 的4000，发现发问不了

11. 开启历史服务就可以访问已结束的任务了

可以看到多了HistoryServer

12. 访问history ui,成功

image.png

13. 查看hdfsz有无生成执行结果文件

文件已生成历史服务配置成功

image.png

转载于:https://www.cnblogs.com/shaozhiqi/p/11534895.html

神经网络的三种训练方法,神经网络训练过程图解

①测定预测精度的方法【误差】—②组合模型【线性组合模型+最优线性组合模型+贝叶斯组合模型】

文章目录 1 测定预测精度的方法

【Kubernetes资源篇】Replicaset控制器入门实战详解

文章目录

VS Code 编译调试Lua和C API

背景 Lua语言是一种脚本语言，边解释边执行，和python有点像。据说在游戏后台应用很多，它的最牛逼之处在于：体量小，很适合在嵌入式系统中使用；与C/C++混合使用灵活；当然，

Window10 安装node.js

中级软件设计师考试经验总结

2023年5月，中级软考终于结束了，对了一下答案，确定的分上午大概55分左右，下午大概55分左右，应该通过是没有问题的。备考时间大概不到1个月吧，中途公司的事也非常忙，只能周末抽出大段时间复习，工作日有时能复习1-2小时，有时1天都没时间看。这里总结一下我复习的一些

linux/debian/ubuntu/下can't open XXX.sh

linux/debian/ubuntu下执行某*.sh出现了 Can't open xxx.sh 执行

chatgpt赋能python：用Python自动化办公在SEO中的应用

用Python自动化办公在SEO中的应用在今天的数字化时代，SEO也成为了许多企业争相攻占的一块蛋糕。而在SEO中，数据分析和信息收集是无法避免的一环，而这些又是非常繁琐的任务，需要大量人力和时间来完成。但是，有没有一种方法可以让

解决已经导入wordcloud还显示ModuleNotFoundError: No module named ‘wordcloud‘的问题

解决已经导入wordcloud还显示ModuleNotFoundError: No module named ‘wordcloud‘的问题参

ELK合集持续更新(二十二):Elasticsearch集群的数据备份和迁移

Elasticsearch集群的数据备份和迁移 – snapshot快照背景 : docker版的ES7集群 (集群搭建见文章 ELK合集持续更新(十五):ELK所