【Basics】Graphx
Reference
Graphx pregel code example: [Processing Hierarchical Data using Spark Graphx Pregel API
Qubole](https://www.qubole.com/blog/processing-hierarchical-data-using-spark-graphx-pregel-api)
graphx official pregel api: GraphX - Spark 3.3.1 Documentation (apache.org)
【阅读】Algorithms to Live By
Algorithms to live by
我觉得很多人应该更熟悉这本书的中文译名,算法之美。看到了微信读书上对于这个译名的评价:为了追求所谓的“信达雅”而没有正确翻译出题目想表达的主题,乍一看还以为是讲算法的,实际上是讲算法在日常生活中的应用的。并且后半部分的翻译好像是为了赶工,看上去并没有针对中国人的表达习惯进行优化,非常像是机翻的,这就导致了后面几章的内容读起来比较晦涩。因此为了避免这个情况,我直接选择读原版的英文版。这反而对于我比较友好,因为上学学算法的时候就是英文教材,很多argot是可以直接代入和理解的,比阅读中文版更能让我理解作者表达的原意。
Regardless of that,这本书讲的还是非常好的。通过算法引申到哪些现实问题其实是这个算法的真实映射,而如果算法本...
【Basics】Functional Programming
Functional Programming
What’s the novelty of functional programming?
什么是函数式编程思维? - 用心阁的回答 - 知乎
Functional Programming通过建立映射的方式获取新的结果,因此是stateless的。想象成,数据流过一个个函数组成的管道,然后变成了另一个值。这是一个基本思想,实际编程的时候,就是返回新的object而不是经过改变的变量。
Materials
Functional Programming Jargon
【Big-Data】Scala
Scala Basics
Learning Materials
scala core
scala spark unit test
scala underscore explained: Scala中下划线“_”的用法小结 - 简书 (jianshu.com)
How to create a maven scala project
Using Idea
archetype
net.alchim31.maven:scala-archetype-simple
Project dependency
Reference
spark version v.s. scala version
Any version of Spark requries a s...
【Basics】Git Rebase
Git rebase
When to use
If you want to have a clean git commits history. If six features are being developed in parallel, they starts from different time and they launch in different times. When you need to roll back some features, you will discover that you have diverged from the main so much.
What is git rebase
When you merge a branch...
【Big-Data】Java Maven
Maven详解
Maven archetype
可以理解为生成项目的template。在脚手架生成项目的时候使用的。
POM文件是Maven的入口文件,标签详解如下
【Big-Data】Flink开发总结
Flink开发(Java版)
1.1 Data Conversion
Reference: Flink DataStream /DataSet 与Table的互相转化_唐予之_的博客-CSDN博客
1.1.1 Imports
import org.apache.flink.streaming.api.scala.
import org.apache.flink.table.api.scala._
import org.apache.flink.api.scala._
import scala.collection.JavaConverters._
1.1.2 Register Datastream of DataSet as Table
// get TableEnvir...
共计 124 篇文章,16 页。