想爬取一些网站用户数据进行分析,请问在爬取数据存入数据库的时候,是以什么为唯一键值的呢?因为有的i网站d可以重名,所以我不知道该如何存储

0
已邀请:
0

Airy 2017-03-06 回答

同学你好,因为你是爬取网站数据,应该是一条条的数据记录,这样的话,你可以直接设置一个自增长的主键,id bigint NOT NULL auto_increment PRIMARY KEY,这样的话虽然网站id有重复的,但是主键不会重复。这样便于统计。
如果你不想创建id字段,可以设置联合主键,比如网站ID和时间戳作为联合主键,就是找两个字段值的组合是唯一的值作为主键就可以,看你的具体情况。

要回复问题请先登录注册