ffpeng's Essay


  • Home

  • Tags

  • Categories

  • Archives

Druid:开源大数据实时处理系统-1

Posted on 2018-10-19 | In BigData | Visitors:
背景找了好久的大数据实时平台,还能面向OLAP分析场景的,仔细罗列了一下,Elasticsearch、Kylin、Druid, 当然还有比较冷门的ClickHouse等等。线上可以使用的无外乎这些主流选择。 Elasticsearch支持实时检索聚合,数据实时elt可以通过ingest Node来 ...
Read more »

Impala常见问题汇总

Posted on 2018-10-18 | In BigData | Visitors:
Impala好用,但也遍地是坑,这里Mark一下,持续更新。 multi count distinct不支持sql如下:12345678select upload_key, max(my_timestamp) as upload_time, max(color_key) as m ...
Read more »

Maven-Shade-Plugin必知必会

Posted on 2018-10-18 | In Tools | Visitors:
问题背景工作项目使用了hadoop-common的jar包,其中内置了protobuf-java 2.5.0版本。123[INFO] +- org.apache.hadoop:hadoop-common:jar:2.6.0-cdh5.11.0:compile[INFO] | +- org.apac ...
Read more »

Hexo必学必会

Posted on 2018-10-18 | In Tools | Visitors:
hexo添加Categories/tags 通过shell新建一个页面,如下hexo new page categories 编辑刚新建的页面,一般处在/sources/categories/index.md, 将页面类型设置为categories,主题将自动为这个页面显示所有分类。 123ti ...
Read more »

Markdown语法必学必会

Posted on 2018-10-16 | In Tools | Visitors:
标题: 1级标题2级标题3级标题4级标题5级标题6级标题 分割线:三个以上的短线即可作出分割线 段落:以一个空行开始,以一个空行结束,中间的就是一个段落。 无序列表:使用 - 加一个空格 无需列表1 无序列表2 无序列表3 有序列表:使用 数字 加一个英文句点 有序列表 有序列表 有序列表 ...
Read more »

The world beyond batch:Streaming 101

Posted on 2018-10-16 | In Streaming | Visitors:
引言流式数据处理在如今的大数据领域是很重要的,无非就是以下这些原因: 商业公司更加渴望及时的数据,而切换成流式技术栈是达到更低的延时的一种方法 海量无边界的数据集合在现代商业公司里面都是越来越普遍,这些数据需要使用一个专业为无限数据设计的系统才能更好的为人所用 当数据在到达的那一刻,可以使系统负载 ...
Read more »

Hello World

Posted on 2018-09-29 | In Diary | Visitors:
Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in ...
Read more »

peng feifei

7 posts
4 categories
12 tags
GitHub E-Mail
© 2018 peng feifei
Powered by Hexo
|
Theme — NexT.Pisces v5.1.4