Data_join
比方我们想获得房地产新房数据,一些字段来自网站a,另一些字段来自网站b(如销量、库存等来自网站b)。如何拼接这些字段呢?暂时想到的是根据楼盘名来拼接。但是楼盘名可以很杂乱,楼盘名相同可能是不同房地产商在不同地域开发的楼盘。还更可能的情况是一个地块上的建筑物,依据物业,依据开盘时间等被分成多个展现却使用相同的楼盘名。假设有个楼盘叫珠江沁园,可能10年开发的叫这个名;因为卖得好,开发商13年在旁边拿地开发仍叫这个名却不冠以二期;之后开发了写字楼还叫这个名;之后开发的别墅还叫这个名。
总之,按百度百科,楼盘是香港对物业的称呼。一套商品房是物业,一层是物业、一栋是物业,几栋也是物业,开发商地块上所有建筑物也是物业,在这个地块上还可以扩建建筑,均可叫楼盘。a网站其可能将一期、二期、住宅、商铺、写字楼、别墅等数据归并为1个楼盘,b网站也可将一期、二期、住宅、商铺、写字楼、别墅等拆分成多个楼盘、甚至其还可以拆分得更随意些,甚至还可以拆分后这几项名字完全相同。那么简单根据楼盘名合并表格是存在问题的。