본문 바로가기
반응형

전체 글184

Pandas Pro가 되기 위해 마스터해야 하는 30가지 방법 Pandas는 의심의 여지없이 테이블 형식 데이터 랭글링 및 처리 작업을 위해 Python으로 구축된 최고의 라이브러리 중 하나입니다. 오픈 소스이기 때문에 전 세계 여러 지역의 수많은 개발자가 개발에 기여하여 다양한 작업을 위한 수백 가지 방법을 지원하여 오늘날의 위치에 도달했습니다. 그러나 초보자가 Pandas 라이브러리에서 확고한 자리를 잡으려고 하는 경우 Pandas의 공식 문서로 시작하면 처음에는 상황이 매우 벅차고 압도적으로 보일 수 있습니다. (이거 언제다 익히냐????) 이번 포스팅에서는 Pandas를 시작하는 데 도움을 주기 위한 것입니다. 이번 포스팅에서는 Pandas를 사용한 경험을 되돌아보고, 거의 항상 사용했던 30가지 구체적인 방법에 대해서 살펴보겠습니다. 라이브러리 가져오기 P.. 2023. 5. 28.
작업 시간을 절약할 수 있는 두 가지 킬러 Jupyter Hacks Jupyter 노트북은 단순하고 능률적이며, 초보자에게 친숙하고 매끄러운 디자인으로 인해 오늘날 모든 Python 지향 작업에 거의 필수 불가결한 에디터입니다. 돌이켜 생각해 보면 Jupyter와 같은 Interactive Python(IPython) 도구가 없는 코딩은 상상조차 할 수 없습니다. 기본적으로 IPython의 가장 중요한 장점은 커널이 활성화되어 있는 동안 개체를 메모리에 유지하여 스크립트를 다시 실행하는 마찰을 줄이는 것입니다. 또한 Jupyter는 일반적인 프로토타이핑 목적으로도 선호됩니다. 이를 통해 데이터 정리, 변환 및 시각화, 수치 시뮬레이션, 통계 모델링, 기계 학습 등과 같은 작업을 비교적 쉽게 수행할 수 있습니다. 그러나 단순성으로 인해 개발자는 프로젝트의 두 가지 기본 기.. 2023. 5. 27.
특정 행(Row) 혹은 열(Column) 선택을 위한 Pandas 함수 - filter 빅데이터 분석을 수행할 때, 가장 기본이 되는 스킬 중 하나는 특정 조건을 만족하는 행(Row)만 추출하거나 특정 열(column)만 추출하는 것입니다. 이런 작업을 수행하는 데 필요한 여러 함수들을 파이썬에서 제공하고 있는데요. 이번 포스팅에서는 pandas내에 있는 filter함수에 대해서 알아볼게요. pandas.DataFrame.filter 함수의 구문은 DataFrame.filter(items=None, like=None, regex=None, axis=None) items: list-like like: str regex: str (regular expression) axis{0 or ‘index’, 1 or ‘columns’, None}, default None 으로 구성되어 있어요. pand.. 2023. 5. 21.
Python 프로그래머가 저지르는 20가지 초보자 실수 Python으로 코딩하는 동안 피해야 할 일반적인 실수 모음 프로그래밍(Python뿐만 아니라 모든 프로그래밍 언어)의 가장 좋은 점은 동일한 로직을 구현하는 방법이 다양하다 는 것입니다. 한 가지 방법만 있다는 것이 아니죠. 다음과 같은 다양한 이유로 상황에 따라서 조금 더 효율적인 프로그래밍 코드가 존재할 수 있어요. 적은 메모리 사용량 런타임 효율성 더 적은 코드 라인 이해하기 쉬운 간단한 논리 등 이번 포스팅에서는 Python 프로그래머가 자신도 모르게 복잡한 Python 코드를 작성하는 함정에 빠지는 20가지 특정 상황을 소개하고자 합니다. 그렇게 되면, 결국 Python의 진정한 잠재력을 발휘하지 못하게 합니다. 이와 함께 이러한 실수를 수정하는 데 도움이 되는 코드도 제공하고자 합니다. 서로.. 2023. 4. 22.
데이터 랭글링(데이터 분석을 위한 15가지 Pandas 기능) 데이터 분석가를 위한 최고의 무기! Pandas! Python의 이 강력한 라이브러리는 데이터 조작 및 탐색을 쉽고 즐겁게 만듭니다. 이번 포스팅에서는 "Palmer Penguins"라는 인기 있는 데이터 세트를 사용하여 Pandas의 고급 기능 중 일부를 살펴보고, 사용 방법의 예를 제공하도록 하겠습니다. # Palmer Penguins 데이터 불러오기 pip install palmerpenguins # palmerpenguins 라이브러리 설치하기 import pandas as pd # pandas 라이브러리 로딩 import seaborn as sns #seaborn 라이브러리 로딩 from palmerpenguins import load_penguins sns.set_style('whitegrid.. 2023. 2. 24.
데이터 과학자가 알아야 할 가장 중요한 5가지 Python 기술 Python은 데이터 분석, 조작, 모델링 등에 사용할 수 있는 다양한 라이브러리와 프레임워크를 제공하므로 데이터 과학자에게 가장 중요한 도구 중 하나입니다. 따라서 다양한 Python 도구와 프레임워크를 터득하는 것이 매우 중요합니다. 그러나 처음 시작하는 사람들의 경우 그 종류와 양이 너무 많아 혼란스러울 수 있습니다. 이번 포스팅에서는 모든 데이터 과학자가 해당 분야에서 성공하기 위해 알아야 하는 5가지 Python 기술에 대해 설명하고자 합니다. 이러한 기술에는 데이터 조작 및 정리, 데이터 시각화, 기계 학습, 웹 스크래핑, 데이터베이스 작업이 포함됩니다. 이번 포스팅을 마치면 모든 데이터 과학자에게 필수적인 핵심 Python 기술을 더 잘 이해할 수 있습니다. 목차 1. 프로그래밍 기초 2. .. 2023. 1. 14.
Python의 Loop? NO! , Python의 Vectorization? OK!!! 소개 프로그래밍에서 루프는 매우 자연스럽고, 거의 모든 프로그래밍 언어로 루프에 대해 배웁니다. 기본적으로 반복 작업이 있을 때마다 루프를 사용합니다. 하지만 엄청나게 많은 수의 반복(수백만/수십억 행)으로 작업할 때 루프를 사용하는 것은 별로 좋은 방법이 아닙니다. 나중에 작동하지 않는다는 것을 깨닫기 위해 몇 시간 동안 갇혀있을 수 있습니다. 그렇기 때문에 파이썬에서는 벡터화를 구현하는 것이 매우 중요합니다. 벡터화(Vectorization)란? 벡터화는 데이터 세트에서 (NumPy) 배열 작업을 구현하는 기술입니다. 백그라운드에서 한 번에 하나의 행을 조작하는 'for' 루프와 달리 한 번에 배열(array) 또는 시리즈(Series)의 모든 요소에 작업을 적용합니다. 이번 포스팅에서는 파이썬 루프.. 2023. 1. 14.
파이썬 코드의 모범 사례 이번 포스팅에서는 파이썬 초보자가 효율적이고 깔끔한 코드를 작성하는 데 도움이 되는 모범 사례를 제시할 예정입니다. 파이썬의 중급 프로그래머이더라도 이번 포스팅을 통해 새로운 트릭과 팁을 찾을 수 있을 것으로 기대합니다. List Comprehensions: List Comprehensions는 기존의 for 문보다 효율적인 파이썬 고유의 코드입니다. for 문을 작성하는 더 짧고, 더 빠릅니다. 파이썬에서 for 문을 사용하는 대신 List Comprehensions를 사용해야 합니다. # List Comprehensions 기본 코드 [표현 for 항목 in 반복구문] # List Comprehensions 기본 코드 + if 문 사용 [표현 for 항목 in 반복구문 if 조건] # List Com.. 2022. 11. 12.
파이썬 클래스 변수 사용법 파이썬에서는 어떤 경우에 클래스 변수를 사용할 수 있을까요? 이번 포스팅에서는 클래스 및 인스턴스 변수에 대해 알아보겠습니다. 클래스 변수 정의 클래스의 모든 인스턴스가 공유하는 변수입니다. 클래스 변수는 클래스 내에서 정의되지만 클래스의 메서드 일부는 외부에서 정의됩니다. 클래스 변수는 인스턴스 변수만큼 자주 사용되지는 않습니다. 인스턴스 변수는 해당 특정 클래스에 대해 생성되는 각 인스턴스에 고유한 변수입니다. 반면에 클래스 변수는 해당 클래스에 대해 생성된 모든 인스턴스에 대해 일반적으로 동일하게 유지되는 변수로 생각할 수 있습니다. 용어 설명은 차치하고, 이해를 돕기 위해 몇 가지 코딩 예제를 살펴보겠습니다. 클래스 변수 사용법 class Employee: def __init__(self, fir.. 2022. 9. 30.
Python-Pandas 함수 및 메서드(30) 이번 포스팅에서는 데이터 분석에 자주 사용되는 30가지의 유용한 python-pandas 함수/메서드를 정리하겠습니다. 1. 데이터 로드 및 이해 2. 열 또는 행 선택 3. 하나 이상의 열을 사용한 데이터 필터링 4. 데이터 정렬 및 열 삭제 5. 데이터 요약 사용한 데이터는 Kaggle의 Airlines.csv입니다. pandas 패키지를 로드하는 것으로 시작하겠습니다. import pandas as pd 1. CSV 파일 로드 # 1. csv 파일의 데이터를 메모리에 로딩 airlines = pd.read_csv("C:/Python_apply/Airlines.csv") 2. 데이터 프레임의 행과 열 수 얻기 # 2. Shape of a dataframe airlines.shape # 결과: (539.. 2022. 9. 18.
파이썬의 유용한 4가지 함수 파이썬 코드를 멋지게 작성하고 싶지만, 최고의 품질을 갖추기 위해서는 다양한 함수를 알아야 합니다. 이러한 목적을 위해 이번 포스팅에서는 4가지 유용한 함수를 알려 드리려고 합니다. 코드 라인을 줄이고 루프를 제거하는 데 도움이 될 것이며 이는 코드를 작성할 때 생산성을 향상할 것이라고 확신합니다. 목차 n개의 가장 큰 수 얻기 n개의 가장 작은 수 얻기 문자열의 특정 부분 제거 리스트에서 중복 값을 제거하는 두 가지 방법 n개의 가장 큰 수 얻기 최댓값을 얻으려면 max 함수를 사용한다는 것을 알고 있습니다. max([15, 21, 30, 20]) # 20 하지만 최대 숫자 리스트를 얻으려면 어떻게 해야 할까요? 파이썬에는 heapq라 불리는 "heap queue"라는 모듈이 있습니다. 이 모듈은 각 .. 2022. 9. 17.
Netflix 컨텐츠에 대한 탐색적 데이터 분석에서 얻은 흥미로운 통찰력 이번 포스팅에서는 Netflix에서 제공되는 TV 프로그램 및 영화에서 흥미로운 통찰력을 얻기 위한 분석을 진행해 보고자 합니다. NumPy, Pandas, Matplot 및 Seaborn 라이브러리를 사용하여 데이터를 분석하고 시각화하도록 하겠습니다. 시작하기 이 데이터세트는 2020년 현재 Netflix에서 제공되는 TV 프로그램 및 영화로 구성되어 있습니다. 해당 데이터는 캐글에서 다운로드하시면 됩니다. (https://www.kaggle.com/shivamb/netflix-shows) import numpy as np import pandas as pd netflixData = pd.read_csv("C:/netflix_titles/netflix_titles.csv") netflixData.hea.. 2022. 9. 13.
Box Plot (분포에서 이상값 감지 및 제거) 머신 러닝에서 특정 데이터 포인트는 다른 데이터 포인트에 비해 모델의 성능이 좋거나 혹은 나쁘게 만듭니다. 이러한 데이터 포인트는 더 자세히 조사하면 데이터 영역 측면에서 매우 비현실적인 경향을 보입니다. 이러한 데이터 포인트를 이상값이라고 하며 이번 포스팅에서는 데이터 세트에서 이상값을 시각화한 다음 감지하고 제거하는 방법을 살펴보겠습니다. 통계에서 이상치는 다른 관측치와 크게 다른 데이터 포인트입니다. 이러한 이상값 데이터 포인트는 실험 오류, 측정의 가변성, 문서 오류 등과 같은 다양한 요인으로 인해 발생할 수 있습니다. 다섯 수치 요약 및 상자 그림(Box Plot) 데이터 세트에서 이상값을 감지하는 가장 널리 사용되는 방법 중 하나는 상자 그림 시각화를 사용하는 것이며, 이 그림을 사용하여 사분.. 2022. 9. 11.
파이썬의 10가지 유용한 팁 Python은 많은 사람들이 가장 선호하는 언어 중 하나입니다. 간결하고 가독성이 높아 모든 프로그래머에게 인기가 있습니다. 이번 포스팅에서는 파이썬 프로그래밍을 시작하는 데 사용할 수 있는 10가지 유용한 팁에 대해서 설명하겠습니다. 1. Negative Rounding(음수 반올림) Python의 round 함수에서는 선택적으로 두 번째 인수를 지정할 수 있습니다. 여기에 음수 값을 전달하면 소수점 왼쪽에서 반올림이 시작됩니다. 즉, 가장 가까운 10, 100 등으로 반올림할 수 있습니다. print(round(1856.667, -1)) # 결과: 1860.0 print(round(1856.667, -2)) # 결과: 1900.0 print(round(1856.667, -3)) # 결과: 2000.0.. 2022. 9. 5.
데이터 처리 시 알아야 할 7가지 메모리 최적화 기술 실제 적용 가능한 기계 학습 모델을 설계하고 구축하는 것은 항상 데이터 과학자에게 큰 관심입니다. 이로 인해 불가피하게 최적화되고 효율적이며 정확한 방법을 대규모로 활용하게 되었습니다. 런타임 및 메모리 수준의 최적화는 실제 및 사용자 대면 소프트웨어 솔루션을 지속 가능하게 제공하는 데 기본적인 역할을 합니다. 이번 포스팅에서는 최적화의 또 다른 영역을 탐색하고 Pandas DataFrame의 메모리 사용을 최적화하는 몇 가지 기술을 소개하고자 합니다. 이러한 방법은 Pandas에서 일반적인 테이블 형식 데이터 분석, 관리 및 처리 작업을 효율적으로 수행하는 데 도움이 됩니다. 1. DataFrame에 대한 내부 수정 DataFrame을 Python 환경에 로드하면 일반적으로 DataFrame에 대해 많.. 2022. 8. 27.
Python 시각화 라이브러리(Seaborn) Python에는 시각적 개체를 만드는 여러 가지 방법이 있지만 그래프로 데이터를 탐색하는 가장 간단하고 효과적인 라이브러리는 Seaborn이라고 할 수 있습니다. 데이터 유형과 분석하려는 대상에 따라 생성할 수 있는 그래프의 "category"가 있습니다. 회귀 및 선형 - regplot, lineplot, lmplot 분포 - distplot , histplot 범주형 - 막대 그림, 상자 그림, 바이올린 그림, 산점도, 개수 그림 행렬 - 열 도표, 클러스터 도표 각 섹션에서 몇 개의 그래프를 선택하고 2개의 데이터 세트에서 흥미로운 인사이트를 발견할 수 있을지 살펴보겠습니다. titanic - 생존에 초점을 맞춘 타이타닉의 승객 정보 tips - 팁 금액에 중점을 둔 레스토랑의 고객 정보 seabo.. 2022. 8. 8.
Confusion Matrix, Precision-Recall, F1-Score 이해하기 분류 기계 학습 모델의 성능을 평가하는 방법은 무엇입니까? 데이터 전처리 단계를 마무리하고, 기계 학습 모델에 적용하면, 확률로 그 결과(출력) 값을 얻습니다. 모델 결과의 성능을 어떻게 측정할 수 있을까요? Confusion Matrix는 분류 모델을 확인하여 모델이 더 좋고 효과적인 방식으로 작동하는 방법을 찾는 가장 좋은 방법입니다. 이번 포스팅에서는 약간은 혼란스러워 보이지만 사소해 보이는 Confusion Matrix와 관련 용어에 대해 알아보도록 하겠습니다. Confusion Matrix(혼동 행렬), Precision(정밀도), Recall(재현율) 및 F1 Score는 정확도(Accuracy)에 비해 예측 결과에 대한 더 나은 직관을 제공합니다. Confusion Matrix(혼동 행렬) .. 2022. 8. 7.
웹 스크래핑 배우기 웹 스크래핑은 마법과 같죠. 인터넷에는 무수히 많은 데이터가 있습니다. 기업은 가격을 비교하고, 고객을 이해하고, 경쟁하기 위해 인터넷에서 데이터를 수집합니다. 우리는 웹 스크래핑의 도움으로 인터넷에서 데이터를 스크래핑할 수 있습니다. 전제 조건: 데이터를 스크랩하려면 Python에 대한 기본 지식만 있으면 됩니다. 파이썬에 대한 기본 지식을 알고 있다고 가정하고 웹 스크래핑을 다뤄보겠습니다. 과제: 이름, 등급, 가격과 같이 Flipkart에 나열된 모든 노트북 세부 정보를 추출하여 비교하고 더 나은 거래를 하도록 도와드립니다. 1단계: 필요한 모든 라이브러리 다운로드 먼저 데이터 스크래핑에 필요한 모든 라이브러리를 다운로드해야 합니다. BeautifulSoup: Beautiful Soup은 HTML .. 2022. 8. 6.
Python에서 *args 및 **kwargs 이해하기 여러분들은 파이썬을 공부하시면서 *args 및 **kwargs를 포함하는 함수에 대한 문서를 볼 때 궁금해 본 적이 있나요? 해당 함수 내부에 전달된 이 이상한 매개변수는 무엇인가요? 예를 들면, function(params, *args, **kwargs)와 같은 구문들이요. 초보자는 해당 함수를 호출할 때 해당 함수를 사용하는 방법이나 * args 및 ** kwargs 대신 인수로 전달할 항목에 대해 혼란스러울 수 있습니다. 그래서 이번 포스팅에서는 *args 및 **kwargs, 그 의미와 함수에서의 사용을 더 잘 이해하는 데 도움이 되는 예제와 함께 설명하겠습니다. 그리고 예제에서 사용된 * 및 **(Unpacking operator)를 가볍게 알아볼게요. 소개 Python의 함수는 다양한 업무에서.. 2022. 7. 31.
단순한 3단계 프로세스로 Matplotlib 차트 개선 파이썬에서 그래프를 표현하기 위해 가장 자주 사용되는 라이브러리는 Matplotlib입니다. 사용 방법이 seaborn 보다는 손이 많이 가는 작업을 필요로 합니다. 이번 포스팅의 목표는 Matplotlib를 사용하라고 강요하는 것이 아니라 Matplotlib를 최대한 단순하면서도 유용하게 활용할 수 있도록 돕는 것입니다. Python을 배울 때 Pandas로 데이터 작업을 진행하고, Matplotlib로 그래프를 그리게 됩니다. 기본 차트가 다소 밋밋하거나, 밋밋해 보이기 때문에 처음에는 지루하다고 생각합니다. 손이 많이 가는 이유 중 하나는 Matplotlib는 차트 사용자 정의 측면에서 매우 강력하기 때문입니다. 오늘 보여드릴 사례는 Matplotlib 라이브러리로 수행된 기본 플롯을 가져오고 3단.. 2022. 7. 27.
Python 인터뷰 질문 및 답변 파이썬패스란? Pythonpath는 Python 인터프리터에게 프로그램으로 가져올 수 있는 모듈 파일을 찾도록 지시합니다. 여기에는 Python 소스 라이브러리 디렉토리와 소스 코드 디렉토리가 포함됩니다. Python에서 메모리는 어떻게 관리됩니까? Python의 메모리는 Python 개인 힙 공간에서 관리합니다. 모든 Python 객체와 데이터 구조는 개인 힙에 있습니다. 이 개인 힙은 Python 인터프리터 자체에서 처리하며 프로그래머는 이 개인 힙에 액세스 할 수 없습니다. Python 메모리 관리자는 Python 개인 힙 공간 할당을 처리합니다. Python 개인 힙 공간용 메모리는 사용되지 않는 모든 메모리를 재활용하고 해제하는 Python의 내장 가비지 수집기를 통해 사용할 수 있습니다. 파이.. 2022. 7. 27.
Python에서 생산성을 높이는 최고의 팁 Python은 아주 깔끔하게 코드를 작성하는 데 도움이 되는 많은 내장 함수를 제공합니다. 하지만, 일반적으로 코드의 품질과 가독성을 향상하기 위해 Python에서 사용되는 몇 가지 생산적인 팁을 잘 인식하지 못합니다. 이번 포스팅에서는 Python의 특징을 활용하여 생산성을 높이는 최고의 팁에 대해서 알아보겠습니다. 자! 코드를 파이썬스럽게 작성해 보겠습니다. List Comprehension 사용 기존 리스트에서 요소를 리스트에 추가하려는 경우 일반적인 방법은 리스트를 반복한 다음 새 리스트에 값을 추가하는 것입니다. 그러나 Python은 리스트 생성을 처리하고 값을 넣는 편리한 방법을 제공합니다. 구문이 더 짧기 때문에 더 깔끔해 보이고 리스트 내에서 단일 for 루프 유틸리티를 사용하여 복잡한 코.. 2022. 7. 27.
앙상블 학습에 대한 설명과 기법에 대한 소개 앙상블 학습에 대한 설명과 기법에 대한 소개 이번 포스팅에서는 기계 학습 모델의 성능을 향상하는 데 도움이 될 수 있는 방법인 앙상블 학습에 대해 알아보겠습니다. 몇 가지 인기 있는 앙상블 전략과 해당 알고리즘에 대해 이야기하기 전에 앙상블 학습이 무엇인지와 그 이점을 먼저 알아보겠습니다. 앙상블 학습이란? 강력한 학습자(learner)를 만들기 위해 여러 개의 약한 모델을 결합하는 것이 앙상블 학습의 기본 아이디어입니다. 일반적인 기계 학습 분류 및 회귀 방법의 기능을 향상시키는 데 유용한 기술입니다. 전체 분류 성능을 향상시키기 위해 앙상블 모델은 많은 분류기(classifiers) 및 회귀자(regressors)의 결과를 결합합니다. 개개인 들이 두 가지 옵션 중에서 어느 것이 올바른지 결정해야 하.. 2022. 7. 23.
(EDA)파이썬을 이용한 탐색적 데이터 분석 프로젝트 Kaggle의 Google Play 스토어 데이터 세트에서 EDA 수행 탐색적 데이터 분석(EDA): EDA(Exploratory data analysis)는 모든 데이터 분석에서 중요한 단계입니다. EDA는 데이터 세트에 대한 이해를 바탕으로 패턴 및 이상치(outlier)를 발견하고, 가설을 세우기 위해 데이터 세트를 탐색하는 프로세스입니다. EDA는 데이터 세트의 수치 데이터에 대한 요약 통계를 생성하고, 데이터를 더 잘 이해하기 위해 다양한 그래픽 표현을 생성하는 것을 포함합니다. 이번 포스팅에서는 Python을 이용해서 예제 데이터 세트를 가지고 EDA의 과정을 처음부터 끝까지 수행해 보겠습니다. 사용하고자 하는 Python library는 Pandas, Numpy, matplotlib, sea.. 2022. 7. 22.
반복문을 활용한 일정 패턴의 변수 생성 - globals() 데이터를 다루다 보면, 특히, 금융 데이터를 다루다 보면, 시점에 따라 유사한 데이터 분석을 해야 할 때가 있다. 월별 대출 실적, 월별 카드 이용 실적, 월별 대출 잔액, 월별 연체율 등등..... 이런 데이터 분석을 하기 위한 데이터를 정의할 때, ******_yyyymm 형식을 많이 사용한다. *****_202206 : 2022년 6월 말 데이터 *****_202207 : 2022년 7월 말 데이터.... 금융기관에서는 아직까지 SAS를 활용한 데이터 분석이 주를 이루고 있다. SAS에서는 매크로를 사용하여 이를 간단히 처리할 수 있다. ex) SAS macro code %macro loan(yyyymm); data library.data_set_&yyyymm. ; set 데이터셋 ; /* sas .. 2022. 7. 16.
파이썬을 활용한 조건에 맞는 엑셀 데이터 찾기 & 수정하기 이번 포스팅에서는 파이썬을 활용해서 조건에 맞는 엑셀 데이터를 찾거나, 수정하는 작업을 진행해보겠습니다. 지난번 포스팅에서 작성한 엑셀 자료를 불러와서 진행하겠습니다. 엑셀 자료를 생성하기 위해서는 아래의 포스팅 글을 참고하시면 됩니다. 파이썬을 활용한 엑셀 셀 영역 다루기1 이번 포스팅에서는 파이썬을 활용해서 엑셀의 셀 영역을 다루는 방법에 대해서 알아보겠습니다. 우선, 간단한 엑셀 데이터를 생성하겠습니다. 예제 데이터 생성하기 10명의 학생에 대한 국어, zzinnam.tistory.com 우선, 데이터를 불러오겠습니다. import openpyxl as xls wb = xls.load_workbook("C:/RPA/begin.xlsx") ws = wb.active 조건에 맞는 엑셀 데이터 찾기 수학.. 2022. 7. 12.
파이썬을 활용한 엑셀 셀 영역 다루기2 지난 포스팅에 이어서 파이썬을 활용해서 엑셀 셀 영역을 처리하는 방법에 대해서 알아보겠습니다. 파이썬을 활용한 엑셀 셀 영역 다루기1 이번 포스팅에서는 파이썬을 활용해서 엑셀의 셀 영역을 다루는 방법에 대해서 알아보겠습니다. 우선, 간단한 엑셀 데이터를 생성하겠습니다. 예제 데이터 생성하기 10명의 학생에 대한 국어, zzinnam.tistory.com 우선, 엑셀 파일 하나를 간단히 생성하겠습니다. import openpyxl as xls from random import * wb = xls.Workbook() ws = wb.active # 데이터 입력하기 ws.append(["학번", "국어", "영어", "수학"]) for i in range(1, 10 + 1): ws.append([i, randi.. 2022. 7. 11.
파이썬을 활용한 엑셀 행 & 열 삽입 및 삭제하기 이번 포스팅에서는 파이썬을 활용해서 엑셀에 새로운 행과 열을 삽입하는 방법에 대해서 알아보겠습니다. 지난번 포스팅에서 작성한 begin.xlsx 파일을 불러와서 해당 파일을 가지고 진행하겠습니다. 엑셀 행 삽입하기 1. 한 줄 삽입하기 8번째 행에 새로운 행 하나를 삽입해보겠습니다. import openpyxl as xls wb = xls.load_workbook("C:/RPA/begin.xlsx") ws = wb.active # 새로운 행 삽입하기(8번째) ws.insert_rows(8) wb.save("C:/RPA/begin_new_insert.xlsx") 2. 여러 줄 삽입하기 이번에는 8번째 줄부터 연속해서 5개의 새로운 행을 삽입해 보도록 하겠습니다. import openpyxl as xls w.. 2022. 7. 10.
파이썬을 활용한 엑셀 셀 영역 다루기1 이번 포스팅에서는 파이썬을 활용해서 엑셀의 셀 영역을 다루는 방법에 대해서 알아보겠습니다. 우선, 간단한 엑셀 데이터를 생성하겠습니다. 예제 데이터 생성하기 10명의 학생에 대한 국어, 영어, 수학 성적을 생성하는 예제 데이터입니다. import openpyxl as xls from random import * wb = xls.Workbook() ws = wb.active # 데이터 입력하기 ws.append(["학번", "국어", "영어", "수학"]) for i in range(1, 10 + 1): ws.append([i, randint(1, 100), randint(1, 100), randint(1, 100)]) # 엑셀 파일로 저장하기 wb.save("C:/RPA/begin.xlsx") # 입력한.. 2022. 7. 10.
파이썬을 활용한 원하는 위치의 엑셀 데이터 출력하기 이번 포스팅에서는 파이썬을 활용해서 엑셀 파일을 불러오고, 원하는 위치에 있는 엑셀 데이터를 출력해 보는 방법에 대해서 알아보겠습니다. 실습을 하기 위해서 지난번에 생성했던 엑셀 파일을 이용하겠습니다. 아래 포스팅 글을 참고하여 먼저 생성하셔야 합니다. https://zzinnam.tistory.com/entry/%ED%8C%8C%EC%9D%B4%EC%8D%AC%EC%9D%84-%ED%99%9C%EC%9A%A9%ED%95%9C-%EC%97%91%EC%85%80-%EC%8B%9C%ED%8A%B8%EC%97%90-%EA%B0%92-%EC%9E%85%EB%A0%A5%ED%95%98%EA%B8%B0 엑셀 파일 불러오기 import openpyxl as xls # 엑셀 파일 불러오기 wb = xls.load_wo.. 2022. 7. 9.
반응형