2025년 8월 14일 목요일

[Python] Pandas Dataframe의 groupby & agg 메서드 (+ Dictinary 자료형 활용)

 groupby 메서드는 dataframe의 데이터를 그룹화해주고 agg 메서드는 그룹화된 데이터에 대해 집계함수를 적용해주는 메서드이다. 


집계 함수 종류는

mean (평균), sum (합계), count (개수), max (최대값), min (최소값), std (표준편차), var (분산)이 있다. 


일반적인 용법은

df.groupby('column_name').agg(agg_func)

여기서 column_name이 그룹화할 기준 컬럼이 되고 agg_func이 집계함수가 된다.


예시)

import pandas as pd


data = {

'category' : ['A', 'A', 'B', 'B', 'C', 'C'],

'value1' : [1,2,3,4,5,6],

'value2': [10,20,30,40,50,60]

}

df = pd.DataFrame(data)


grouped_df = df.groupby('category').agg({'value1':'mean', 'value2':'sum'})

print(grouped_df)


output:

category    value1    value2

A                1.5            30

B                3.5            70

C                5.5            110


groupby 메서드 & agg 메서드를 사용하여 'category' 컬럼을 기준으로 그룹화하고, 'value1', 'value2' 컬럼에 대해 각각 평균과 합계를 계산한 결과이다.


agg 매서드에 딕셔너리를 전달하면 각 컬럼에 대한 집계함수를 구할 수 있다.


예시 2) lambda 함수 활용

grouped_df = df.groupby('category').agg(lambda x : x.max() - x.min())

print(grouped_df)


이렇게 lambda함수를 활용하여 사용자 정의 집계 함수를 적용할 수도 있다. 


예시 3) 딕셔너리 unpacking

** 인자는 딕셔너리의 각 element를 전달할 때 사용한다. 즉 dictionary의 element들을 각각 분리하여 전달한다.


agg_dict = {'value1' : 'mean', 'value2' : 'sum'}

grouped_df = df.groupby('category').agg(**agg_dict)


이 때 위 예시에서 
grouped_df = df.groupby('category').agg({'value1':'mean', 'value2':'sum'})
이렇게 직접 agg매서드 내에 딕셔너리를 전달할 때는 dictionary로 전달이 가능하나

agg_dict처럼 dictionary를 변수로 받아 전달하는 경우 **를 붙여 dictionary unpack이 필요하다.
아닌 경우 아래와 같은 에러가 나타나게 되는데


TypeError: agg() missing 1 required positional argument: 'func'

이 에러는 agg매서드가 agg_dict딕셔너리를 함수로 인식하지 못하고, 대신 func라는 인자를 요구하게 된다. (... 잘은 이해는 안돼지만 그렇다고 한다).


예시 4) 딕셔너리 for문으로 정의하기

elements = ['value1', 'value2']

agg_dict = {col : 'mean' for col in elements}

딕셔너리 활용 예시인데 모든 column에 대한 집계함수를 mean으로 받고자 하면 위와같이 for문을 이용하여 dictionary를 정의할 수 있다.

이후

grouped_df = df.groupby('category').agg(**agg_dict)

하면 집계함수를 구할 수 있다. 

2025년 7월 19일 토요일

C# Dispose 매서드의 용도

아래와 같은 예시코드


public class MyComponent : Component

{

    protected override void Dispose(bool disposing)

    {

        if (disposing)

        {

            // 관리되는 리소스를 해제합니다.

        }

        // 관리되지 않는 리소스를 해제합니다.

        base.Dispose(disposing);

    }

}


프로그램 initialize 단계에서 위와 같은 코드가 들어간다. 이유는? 메모리 누수를 방지하기 위해.

메모리 누수란?
  • 메모리 누수(Memory Leak)는 프로그램이 더 이상 사용하지 않는 메모리를 해제하지 않아서 발생하는 문제입니다.
  • 메모리 누수가 발생하면 프로그램이 사용하는 메모리가 계속 증가하여 성능 저하, 심지어 프로그램이 종료될 수 있습니다.


좀 더 넓게 보면 1) Dispose 매서드는 실행하는데 필요한 리소스를 명시적으로 해제하며 메모리 누수도 방지하게 된다. 2) 추가로 컴포넌트의 라이프 사이클을 관리, 즉 객체의 생성, 사용, 해제를 관리하는 의미도 있다. 크게 보면 두 가지 목적이 있는 것.

리소스는 컴포넌트가 실행되는 동안 사용되는 시스템 자원을 일컫는데 예를들면,

- 메모리 : 컴포넌트가 사용하는 객체, 데이터 구조 등을 위해 할당되는 공간
- 파일 핸들 : 컴포넌트가 사용하는 파일, 스트림 등
- 네트워크 연결 : 컴포넌트가 사용하는 소켓, 네트워크 연결 등
- GDI (Graphic Device Interface, Windows 운영 체제에서 그래픽스 출력을 담당하는 API) 리소스 : 컴포넌트가 사용하는 그래픽스 장치 인터페이스 리소스 등

이 있다. 

관리되는 리소스와 관리되지 않는 리소스가 구분되는데 관리되는 리소스는 .NET 런타임에 의해 관리되는 리소스이다. 예를 들어, .NET 객체, 배열 등이 관리되는 리소스에 해당하고, 관리되지 않는 리소스는 반대로 .NET 런타임에 의해 관리되지 않는 리소스로, 예를들면 파일 핸들, 네트워크 연결, GDI 리소스 등이 관리되지 않는 리소스에 해당한다.


이러한 리소스 사이클 관리를 하는 dispose매서드를 파이썬에서 구현한다면 아래와 같이 객체 소멸자를 정의할 수 있다. 

import contextlib

class MyClass:
    def __init__(self):
        print("객체가 생성되었습니다.")

    def close(self):
        print("객체가 해제되었습니다.")

    def __del__(self):
        print("객체가 소멸되었습니다.")

with contextlib.closing(MyClass()) as obj:
    # 객체 사용
    pass


파이썬 프로그래밍에서도 이러한 리소스 관리가 필요할까? 










2024년 2월 9일 금요일

Note

Conda 가상환경 생성 / 제거

>conda create --name [Name] / conda remove --name [Name] --all

** 특정 python 버전 가상환경 생성인 경우

>conda create --name [Name] python=3.8 pip

Conda 가상환경 실행 /  종료

>conda activate [Name] / conda deactivate

 Conda 가상환경 패키지 확인 

>conda env list

설치된 python package 확인

>conda list


가상환경 패키지 update

>conda update -n base conda

>conda update --all


PIP package 설치

>pip install [PackageName]


Pygame 참고 site : https://sweetburble.tistory.com/33

Auto Encoder : https://deepinsight.tistory.com/123

가상환경 재설치 참고 : conda 가상환경 패키지를 저장하고 다른 컴퓨터에 똑같이 설정하기 (tistory.com)



2022년 9월 25일 일요일

[Python 3.6] Anaconda 설치 후 가상환경 생성 / 기본 패키지 설치 (numpy / OpenCV 등 )

 Conda 가상환경 생성 / 제거

>conda create --name [Name] / conda remove --name [Name] --all

** 특정 python 버전 가상환경 생성인 경우

>conda create --name [Name] python=3.8 pip


Conda 가상환경 실행 /  종료

>conda activate [Name] / conda deactivate

 Conda 가상환경 패키지 확인 

>conda env list


가상환경 내 패키지 설치

> conda install [PackageName]

or PIP package 설치

>pip install [PackageName]


conda나 PiP 둘중 아무거나로 설치 진행

(코드 내 import된 패키지들 설치.)

eg)

>conda install numpy

혹은 

>pip install numpy

(패키지 설치시에는 구글링을 통해 특정 버전의 이슈가 있는지 확인해 보는게 좋다).


가상환경 패키지 update

>conda update -n base conda

>conda update --all

2022년 9월 22일 목요일

[VS Code] Python Extension in VS Code

 https://bas.codes/posts/best-vscode-extensions-python


Conda 명령

https://dowtech.tistory.com/14



2021년 3월 3일 수요일

[캠핑] 동계 침낭 비교 (FEATHERDOWN WINTER-1500g, F-1300g 비교)

보유하고 있는 침낭이 보이스카웃 때 받은 것이 유일하다. 10살 때 처음 받은 침낭을 아직도 쓰고 있는 것이다. 이 침낭으로 그 동안 겨울에도 잘도 다녔다. 

하지만 올해 2월 말 캠핑을 다녀오고 나서 깨달았다. 아, 이러다 죽겠구나. 

겨울이 끝나가는 시점이라 낮에는 영상 10도 수준까지 올라가는 날씨였지만, 해가 지고나자 영하로 기온이 떨어졌고, 새벽에 확인한 온도는 영하 5도였다. 

사실 생각보다 낮은 기온은 아니었지만, 믿었던 핫팩 2개 모두 불발하면서 밤새 추위와 싸우며 거의 잠을 못잤다.

이를 계기로 겨울용 침낭을 구매하기로 하고 추천받은 FEATHERDOWN제품을 비교해 보았다. 

결론은 F-1300g제품이 끌린다. 패킹시 부피, 중량 면에서 좀 더 작은 것을 선택하려고 하다보니 나온 결론이다.

1. 디자인은 둘 다 번데기같은 디자인이라 크게 비교할 건 없을 듯.

2. 패킹사이즈 : 적혀져 있는 정확한 정보는 없지만 사진 정보로 미루어 봤을 때 높이만 F-1300g이 약 5cm 작다는 것 같다.

3. 중량 : Winter-1500g : 2000g, F-1300g는 1860g

4. 필파워 : Winter-1500g 700FP vs F-1300g 800FP

5. Size (가슴 x 길이 cm) : Winter-1500g 80 x 210, F-1300g 82 x 205


지르러 가자.

(상세 정보, 출처는 맨 아래)

FEATHERDOWN WINTER-1500g

패킹 사이즈
내한온도
상세정보


FEATHERDOWN F-1300g
디자인

패킹 사이즈
내한온도
상세정보

출처

WINTER-1500g (featherdown.co.kr)

F-1300g(Pertex Shell) (featherdown.co.kr)

2021년 3월 1일 월요일

[캠핑] 텐트 스펙 비교 Vango Alpha 300 / MSR Elixir 2 Gold

지금 보유중인 Vango Alpha 300. 3인용 텐트로 밝은 파랑색 색상과 큰 size가 맘에 들기도 했고 마침 행사중이어서 약 15%할인가에 구매해서 백팩킹 및 캠핑용으로 사용중이다.

구매 후 수차례 백팩킹과 캠핑을 다녀본 결과 색상이나 내부 공간의 넉넉함에 만족하고 사용하고 있었다.

다만, 조금 더 경량화를 하면 좋겠다는 생각이 들었다. 같이 백팩킹을 다니는 친구의 경우 솔캠을 위한 2인용 텐트를 구매하여 들고다녔는데, 큰 텐트를 들고 다니다가 가볍고 부피도 작은 텐트를 솔캠용으로 다니기 편하다고 하는 말에 조금 더 작은 텐트 구매를 생각하고 있던 참이었다.

마침 캠핑 중 지나가다 본 MSR Elixr 2 Gold 디자인이 너무 맘에들어서 경량화 관점에서 기존에 가지고 있던 Vango Alpha 300과 스펙 비교를 해보았다. 

중요한 것은 size와 무게! 그리고 부피.

부피 비교는 사실 어려울 것 같다. 무게는 약 1.5kg 줄일 수 있을 것 같고 실내 size로 봐도 누울 공간 제외하고 MSR 제품이 여분의 공간이 좀 있을 것 같다.

결국은 지르러 갈 예정.
이런 스펙비교는 겉다리일 뿐. 이미 나는 디자인과 색상에 마음이 가버렸음.

Vango Alpha 300






Weight : 4.2kg (팩 제외 3.9kg)
Size : 210 x 180 x 125 cm

MSR Elixir 2 Gold


Weight : 2.77kg
Size : 213 x 127 x 102 cm




 정보 / 그림 출처

Web site :

Vango  : Vango Alpha 300 | Camping-equipment | Vango UK

MSR : Elixir™ 2 Gold(엘릭서 2 골드) | MSR® Tents, Stoves, Cookware (msrgear.co.kr)

국내 쇼핑몰:

[반고] 알파 300 모로칸 블루 텐트 - 3인용/돔텐트 - CJmall

엘릭서 2 골드 (11st.co.kr)