1
推荐
981
阅读
dataframe 保存csv 中文编码
首行出现的”\ufeff“叫BOM("ByteOrder Mark")用来声明该文件的编码信息.”utf-8“ 是以字节为编码单元,它的字节顺序在所有系统中都是一样的,没有字节序问题,因此它不需要BOM,所以当用"utf-8"编码方式读取带有BOM的文件时,它会把BOM当做是文件内容来处理, 也就会发生类似上边的错误."uft-8-sig"中sig全拼为 s...
1
推荐
9017
阅读
linux访问windows共享文件夹错误:mount error(115): Operation now in progress
解决方法1. 关闭windows防火墙方法2. 不关闭防火墙。设置防火墙入站规则中,关于文件和打印机共享中关于samba的ip允许设置控制面板/系统和安全/Windows防火墙/高级设置/入站规则/文件和打印机共享(SMB-In)公用/属性/作用域/远程IP从本地子网改为任何IP1. windows目录设置高级共享2.设置防火墙规则任何IP3.linux下运行:
0
推荐
1191
阅读
python 查看变量占用内存大小 千分位显示
变量dfimport sys
s=sys.getsizeof(df)
print('{:,}'.format(s))
0
推荐
1075
阅读
python 用 pool 实现并行
map并行from multiprocessing import Pool
# 定义函数,每个子进程执行体
def abc(i):
s=i+1
s.to_csv()
# 定义参数列表
flist = list(range(10000))
# 实例化
pool = Pool(10)
# 通过map把flist里的每个元素,传递给子进程,每个子进程按照传入的参数执行abc函数
pool.map(abc,flist)
# 关闭pool...
0
推荐
1655
阅读
fpgrowth算法
一、关联规则的三个指标:1) 支持度 support(A => B)
= P(A,B) = |A n B| / |N|,表示数据集D中,事件A和事件B共同出现的概率
2) 置信度 confidence(A => B)
= P(B|A) = |A n B| / |A|,表示数据集D中,出现事件A的事件中出现事件B的概率
3) 提升度 lift(A => B)
= P(...
0
推荐
5169
阅读
pandas dataframe 用 loc 或 iloc 行列选择
参考pandas详细介绍:https://www.jianshu.com/p/79800cad3656单个索引:选列,得到Series
两个索引:先选列再选行,得到元素本身类型
带冒号的索引:选行,得到DataFrame
df[0] 0列, 得到 Series
df[0][1] 0列1行, 得到 str (所在位置元素本身类型)
df[0][0:2] 0列0~1行, 得到 Series
df...
1
推荐
1208
阅读
mean median mode,均值 中位数 众数
有n个数,数值可以有重复,如: 1, 2, 2, 3, 3, 8, 9mean | 均值 | 唯一| n个数值的平均 | 1,2,2,3,3,8,9的均值是(1+2+2+3+3+8+9)/7=4
median | 中位数 | 唯一| 无论数值是否重复,都从小到大排列,位于中间位置的那个值(奇数个),中间位置两个数的平均(偶数个)| 1,2,2,3,3,8,9的中位数是3,而1,2,3,...
0
推荐
2749
阅读
Nginx+ uwsgi + flask 显示真实IP
一、在机器1(prod03)上, Nginx反向代理端口7077到机器2(lookalike_server)上Nginx能够配置代理多台服务器,利用upstream实现负载均衡http {
# 1. 在http节点下,加入upstream节点:
# upstream 定义一组 HTTP服务器,这些服务器可以监听不同的端口
upstream lookalike_server {
serv...
0
推荐
1671
阅读
excel中批量插入图片
一、选择性粘贴Unicode文本1. 修改如下文本,指定要显示的图片及其位置、高宽,然后复制<table><img src="D:\Pictures\015.jpg" width="140" height="140">
<table><img src="D:\Pictures\016.jpg" width="140" height="140">
<table><img src="D:\Pictures\017.jpg" width="140" heig...
0
推荐
1657
阅读
pip install lxml 提示错误 Could not find a version that satisfies the requirement lxml
pip install lxml -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com
0
推荐
1638
阅读
jieba 包 pip install 时 time out,手动下载安装
1. pip 安装总是 time outpip install jieba2. 指定 time out 时间,问题依旧pip --default-timeout=100 install jieba
3. 手动下载wget https://files.pythonhosted.org/packages/71/46/c6f9179f73b818d5827202ad1c4a94e371a29473b7f043b736b4dab6b8cd/jieba-0.39.zip4. 进入解包目录安装python setup.py install
0
推荐
1467
阅读
git branch, fork, clone, pull, fetch含义
branch:从开发主线上分离,在不影响主线的同时继续工作,是 Git版本控制的特色fork:在github页面,点击fork按钮。将别人的仓库复制一份到自己的仓库。是服务端的代码仓库克隆。git clone:从无到有将仓库克隆到本地,不需要git init初始化。git fetch:从远程获取最新版本到本地,不会自动mergegit pull:从远程...
0
推荐
2359
阅读
CentOS的批量改名命令 rename和prename
1. rename 命令批量改文件名C版本:rename 原字符串 新字符串 文件名
rename a b * # 目录下存在两个文件: a_01 、a_02,将a换成b
rename log history *.log # 将所有 .log 文件名中的log换成historyPerl版本:支持正则表达式rename ‘s/原字符串/新字符串/’ 文件...
0
推荐
1195
阅读
SSH公钥登录,省去输入密码
生成SSH公钥并上传远程主机在本地运行以下命令,生成公钥并上传到远程主机:ssh user@host # 连远程主机,首次提示,yes
ssh-keygen # 一路回车
ssh-copy-id user@host # 公钥上传到远程主机
本地运行scp拷贝文件到远程主机,无需输入远程主机密码:scp -r ./cnn/* user@host:/work调用远程主机上的shell脚本ss...
0
推荐
1787
阅读
python采用cx_Oracle往oracle里插入中文报错 UnicodeEncodeError: 'ascii' codec can't encode characters
查看python编码import sys
sys.getdefaultencoding()
'utf-8'查看oracle数据库编码select userenv('language') from dual;
SIMPLIFIED CHINESE_CHINA.ZHS16GBK解决设置和数据库一致的编码 export NLS_LANG="SIMPLIFIED CHINESE_CHINA.ZHS16GBK"参考:https://blog.csdn.net/qq_40546896/article/details/...