Spark Scala 范例

1.处理HDFS日志文件中错误日志

val lines = sc.textFile("hdfs://...")  //lines is a org.apache.spark.rdd.MappedRDD
val errors = lines.filter(_.startsWith("ERROR")) //errors is a org.apache.spark.rdd.FilterRDD
errors.cache() //persist到内存中
errors.count()  //触发action，计算errors有多少个，即ERROR的多少行

errors.filter(_.contains("MySQL")).count()
errors.filter(_.contains("HDFS")).map(_.split('\t')()).collect()

2. SQL RDDRelation

package org.apache.spark.examples.sql

import org.apache.spark.{SparkConf,SparkContext}
import org.apache.spark.sql.SQLContext
import org.apache.spark.sql.functions._

case class Record(key:Int, value:String)

object RDDRelation{
    def main(args: Array[String]){
        val sparkConf = new SparkConf().setAppName("RDDRelation")
        val sc = new SparkContext(sparkConf)
        val sqlContext = new SQLContext(sc)

import sqlContext.implicits._

val df = sc.parallelize( to ).map(i => Record(i, s"val_$i"))).toDF()

df.register
    }
}

为什么要用POD

（1）市面上使用最多的，大部分企业使用PDO （2）Mysqli 只支持mysql数据库，PDO支持大部分数据库

GD32F3 串口的重映射

工作中使用需要USART0 重映射到PB6(TX) 和PB7(RX) 上； 1.根据手册查只能部分映射

Web端720°VR全景新手入门踩坑记录：three.js+photo-sphere-viewer.js

如果对three.js一无所知的同学可以先看一篇关于three.js的介绍（什么是three.js）：

K8S Affinity亲和性

目录一、node亲和性

redis基础

lerna学习笔记

背景：公司项目中开始使用，因为项目过多所以使用lerna进行项目管理，所以自己也下来想搭建和学习一下。官网：https://ww

PostgreSQL 使用记录

1. 重命名数据库时，报错：“其他用户正在使用数据库...” 报错如下： ERROR: 错误: 其他用户正在使用数据库 "<DBname>" DETAIL:

linux启动镜像命令,linux命令制作iso镜像

第一：制作iso镜像的方法：把/dev/cdrom目录制作为镜像，名字为/root/rh1.iso 方法1：dd if=/dev/cdrom of=/root/rh1.iso 方法2：#cat /dev/cdrom >;/root

js获取元素的宽高

//获取到元素 var o = document.getElementById("view"); //获取此元素的高度 var height = o.o

SSRNet 三维重建

SSRNet: Scalable 3D Surface Reconstruction Network 论文原地址