冷热集群数据同步、分类存储
集群数据整体搬迁
- 当公司业务迅速的发展，导致的当前的服务器数量资源出现临时紧张的时候，为了更高效的利用资源，会将A机房数据整体迁移到B机房的，原因可能是B机房机器多，而且B机房本身开销较A机房低些等
数据的准实时同步
- 数据准实时同步的media在于数据的双倍份可用，比如某天A集群突然宣告不允许再使用了，此时可以将线上使用集群直接切向B的同步集群，因为B集群实时同步A集群数据，拥有完全一致的真实数据和元数据信息，所以对于业务方使用而言是不会收到任何影响的。

数据迁移要素考量

Bandwidth-带宽
- 带宽用的多了，会影响到线上业务的任务运行，带宽用的少了又会导致数据同步满的问题。
performance-性能
- 是采用简单的单机程序？还是多线程的性能更佳的分布式程序？
data-increment-增量同步
- 当TB,PB级别的数据需要同步的时候，如果每次以全量的方式去同步数据，结果一定是非常糟糕。如果仅针对变化的增量数据进行同步将会是不错的选择。可以陪着HDFS快照等技术实现增量数据同步。
syncable-数据迁移的同步性
- 数据迁移的过程中需要保证周期内数据是一定能够同步完的，不能差距太大。比如A集群7天内的增量数据，我只要花半天就可以完全同步到B集群，然后我有可以等到下周再次进行同步，最可怕的事情在于A集群的7天内的数据，我的程序花了7天还同步不完，然后下一个周期又来了，这样就无法做到准实时的一致性，其实7天还是一个比较大的时间，最好是能达到按天同步。

HDFS分布式拷贝工具-DistCp

hadoop distcp hdfs://src_cluster:8020/user/data hdfs://dest_cluster:8020/user/data_backup

这个命令告诉distcp工具将hdfs://src_cluster:8020/user/data目录下的数据复制到hdfs://dest_cluster:8020/user/data_backup目录下。

Problem: You are climbing a stair case. It takes n steps to reach to the top.

版本对应

1.重新安装msdtc 一般而言，在运行 Windows XP 或更高版本的计算机上不必重新安装 Microsoft 分布式事务处理协调器 (Msdtc.exe)。如果使用较早的操作系统，在安装诸如 Microsoft SQL Server

　　cmd-line模式又有3个类型：Ex 命令（ex commands）、查找模式（Search patterns）、Filter 命令（Filter commands）。本文主要重点的是

http://www.111cn.net/sys/nginx/80785.htm ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎，基于RESTful web接口。Elas

index.html <!DOCTYPE html

什么是例行性命令？每个人或多或少都有一些约会或者是工作，有的工作是例行性的，例如每年一次的加薪、每个月一次的工作报告、每周一次的午餐会报、每天需要的打卡等等；有的工作则是临时发生的，例如刚好总公司有高官来访，需要