关于Kettle Solution 一书的翻译



public class BaseStep extends Thread implements VariableSpace, StepInterface{



public class BaseStep implements VariableSpace, StepInterface, LoggingObjectInterface{


也就是说4.0版本的kettle中的step将不会启用新线程执行了, 这一重大改变会使得转换里面的step将按设计的顺序执行,但就KETTLE的作者MATT的个人观点,说这没有什么不同:


集群能使得kettle的执行可以水平扩展,对于大数据量的处理,这一点尤其重要,但确实很难做好,因为涉及到机器之间的协调,理想状态是让处理的数据像游泳池通道一样,尽量不相互影响,直到数据处理流程完成,所以引入了分区的概念,这里面的分区是不是个玩物,还需要考验,O(∩_∩)O~ 能迈出这一步就不容易了 值得赞赏!

