开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 8691|回复: 0
收起左侧

[图文教程] 使用python把Excel表格由一个分隔成多个

[复制链接]
结帖率:56% (5/9)
发表于 2018-7-11 09:32:30 | 显示全部楼层 |阅读模式   云南省昆明市
最近经常用到Excel导入数据,公司的网站是PHP做的,型号价格的更新每次都是通过Excel导入。

        一次性两万条记录的导入勉强可以,数据量再大就超时了。而有些产品的价格表格在5万以上,此时导入的时候就需要拆分成几个数据量少于2万的表格。每个类型码有多个Excel表,靠手工来操作不是程序员该干的事情,于是我用起了不是很熟练的Python来解决。

        代码如下,希望给新手一个帮助。(其实我也是python新手^^)

        Excel表格放在同目录下的file目录,并新建一个new文件夹存放拆分后的Excel表格。字段我是写死了两行的,实际使用需要修改。
# -*- coding: utf-8 -*-
import os
import math
import xlrd
import xlwt

dir = os.getcwd()+'\\file\\'


def get_file_list(file_dir):   
    for root,dirs,files in os.walk(file_dir):  
        return files

def split_xls(name):               
        limit = 10000
        print(name)
        limit = int(limit)
        data = xlrd.open_workbook(dir+name)
        # 获取sheet
        table = data.sheets()[0]
        # 行数
        nrows = table.nrows
        print('总行数{}'.format(nrows))
        # 列数
        ncols = table.ncols
        sheets = math.ceil(nrows / limit)
        print('拆分文件数量:{}'.format(sheets))
        workbook = xlwt.Workbook(encoding='ascii')
        for i in range(int(sheets)):
                if i == 0:
                        start_row = 0
                else:
                        start_row = i*limit
                if i == sheets-1:
                        end_row = nrows
                else:
                        end_row = (i+1)*limit
                #print(start_row)
                #print(end_row)
               
                new_arr = []
                new_arr.append(['型号','未含税价'])
                for row in range(start_row,end_row):
                        if i == 0 and row == 0:
                                continue
                        sku = table.cell_value(row,0)
                        price = table.cell_value(row,1)
                        new_arr.append([sku,price])
                #print(new_arr)       
               
                new_workbook = xlwt.Workbook()
                new_worksheet = new_workbook.add_sheet('Sheet1',cell_overwrite_ok=True)
                for new_row in range(0,len(new_arr)):
                        new_worksheet.write(new_row,0,new_arr[new_row][0])  
                        new_worksheet.write(new_row,1,new_arr[new_row][1])
               
                old_name = name.split('.')
                new_name = old_name[0]+'-'+str(i)+'.xls'
                new_workbook.save(os.getcwd()+'\\new\\'+new_name)
        print('************************************')
               

if __name__ == '__main__':
        file_list = get_file_list(dir)
        for name in file_list:
                split(name)


您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表