0
推荐
1494
阅读
ben-老师第三次作业提交
# -*- coding: utf-8 -*-"""Created on Tue Jul 3 09:01:06 20181、背景介绍:一家婚恋网站公司希望根据已注册用户的历史相亲数据,建立新用户相亲成功可能性的预测模型,数据存放在“date_data2.csv”中。2、主要变量说明如下:#income-月均收入(元)#attractive-由婚恋网站评定出的个人魅力值,分值从0-100。#asset...
1
推荐
1487
阅读
转载ben老师第三讲答案,膜拜的同时分享给大家
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
import seaborn as sns
import os
os.chdir(r'C:\Users\知行合一\Documents\ben\HW5')
In [2]:import sqlite3
In [3]:con=sqlite3.connect(':memory:')
card=pd.read_csv(r'card.csv',encoding='gbk')
disp=pd.rea...
1
推荐
1474
阅读
ben老师第二次作业提交
Created on Sat Jul 7 16:12:18 2018@author: 知行合一"""'''研究二手房价的影响因素,建立房价预测模型,数据存放在附件的“sndHsPr.csv”中。分析思路:在对房价的影响因素进行模型研究之前,首先对各变量进行描述性分析,以初步判断房价的影响因素,进而建立房价预测模型。变量说明如下:dist-所在区 roomnum-...
0
推荐
1322
阅读
ben第一次作业
1、学习pandas,dataframe数据提取2、数据清洗:计算列之间的字符转化,str->datetime, datafram['strdate'].astype('datetime64')str->int (根据正则表达是进行解析)onehistory['转化后的数字字']=onehistory['数字字符串列'].map(lambda x:int(''.join(x[1:].split(','))))3、数据分组统计:groupby(...