본문 바로가기

Language/python

http 호출 url들을 추출하여 엑셀생성

반응형

특정 폴더안에 엑셀파일들을 읽어들여 url들을 호출하여 엑셀생성

 

import openpyxl
import pandas as pd
import os

# url리스트가 있는 파일들이 D:/files에 있고 해당 디렉토리에 파일리스트를 출력
path_dir = 'D:/files'
file_list = os.listdir(path_dir)
print(file_list)

# 새로생성할 엑셀시트 생성
new_wb = openpyxl.Workbook()
new_wb.remove(new_wb['Sheet'])

for t in file_list:
    wb = openpyxl.load_workbook(path_dir+'/'+t)

    sheet1 = wb['Sheet']

    sheet1.title = "이름 변경"
    print(sheet1.title)
    print(sheet1.cell(row=1,column=1).value)

    df_raw = pd.DataFrame(index=range(0,110), columns=['A'])
    df_modify = pd.DataFrame(index=range(0,110), columns=['A'])


    # df_raw에 엑셀 데이터 넣기
    for i in range(0,100):
        df_raw.iat[i,0]=sheet1.cell(row=i+1, column=2).value

    # df_modify에 '스탭내용'이 포함된 문자열만 넣기
    count = 0
    for i in range(0,100):
        row_val=str(df_raw.iat[i,0])
        if(row_val.find('HTTP Call')>0):
            templist = row_val.split('\'')
            df_modify.iat[count,0]=templist[3]
            count = count +1


    print(pd.DataFrame(df_modify))


    ws1=new_wb.create_sheet(t)

    # df_modify의 값을 엑셀 시트에 저장하기
    for i in range(0,len(df_modify.columns)+1):
        ws1.cell(row=i+1,column=1).value = df_modify.iat[i,0]

    new_wb.save('D:\\csv_extract\\test2.xlsx')

extract.py
0.00MB
files.alz
0.01MB

반응형