本人用的hive,可以理解為關系型數據庫,現在的需求是,有一塔數據,數據中都有手機號,我需要看看這一沓數據中有哪些是數據里已經有了的。目前我的做法是,先取一條,然后按照手機號遍歷整張表,然后下一條,遍歷,下一條,遍歷。。。。。。我覺得此法即使加了索引效率也很低,求一個效率高的sql,或者思路
【數據庫】我需要一個查重效率高的方法
慕田峪9158850
2018-07-17 11:14:38