[파이썬] pandas-profiling

지훈현서|2020년 4월 27일
Posts
[파이썬] pandas-profiling

[파이썬] pandas-profiling

지훈현서|2020년 4월 27일

pandas 는 웨스 메키니(Wes McKinney) 라는 개발자 분이 만든 툴로 AQR Capital Management에서 근무하던 2008년부터 개발한 금융 데이터에 대한 계량적 분석을 수행하기 위한 고성능의 유연한 툴을 만들면서 시작되었습니다. 개인적으로는 2016 PyCon Korea 코엑스 발표장에서 Keynote 발표 시 아주 가까이서 봤던 기억이 있습니다. 특히 jupyter lab 등으로 jupyter notebook 으로 Interactive 작업을 하며 데이터 과학자 등에게데이터 가공하는 툴로 아주 필수적인 모듈이 되어 버렸습니다. pandas를 이용하여 데이터를 (데이터 프레임) 가공하여 해당 자료에 대한 상세 프로파일링을 할 수 있는pandas 상위 툴이 존재하는데 pandas-

Related Posts

3 posts

[Python] pypicloud 로 사설 모듈 저장소 이용하기

지훈현서|2020년 7월 28일

일전에 pypiserver 를 docker에서 돌리는 것을 해 본 적이 있습니다. 사설 파이썬 모듈을 관리하는데 이용하는 것은 문제 없지만,UI 가 없기 때문에 관리 등을 하는 것에는 어려움이 있었습니다. 다행히 이런 것을 위해서 UI를 제공하는 pypicloud 라는 것이 있어서 이를 소개해 봅니다.그런데 왜 이름이 cloud 가 붙었을까 하고 살펴보니, 백엔드 모듈이 저장되는 곳이로컬 파일 뿐만 아니라, 아마존의 S3 또는 구글의 GCS에 저장할 수 있습니다.모듈이 수십개가 아니라 수백개 이상 된다면 해당 모듈을 쉽게 찾아가고 하는 등의 장점을 pypicloud가 제동한다고 보면 됩니다. 각 모듈을 위한 색인을 SQLite 또는 Redis 등을 이용할 수 있으므로 상당히 빠르게 모듈을 찾는다고보면 되

[Windows] 레지스트리에서 설치된 언어 확인하기

지훈현서|2020년 7월 13일

이번에는 윈도우 (10에서 테스트) 에 보면, 설치된 OS 언어와 무관하게 여러 언어를 설치할 수 있고 이것의 우선 순위 및 화면에 출력되는 언어도비교적 자유롭게 설치할 수 있는데요, 이것을 구해오는 법을 알아보겠습니다. 역시 API도 있겠으나 레지스터리에서 구해보았습니다. HKEY_CURRENT_USER 에서 \software\Microsoft\CTF\SortOrder\Language에 보면 위와 같이 데이터 들이 들어있는데, 각각의 Hex 값으로 로케일 언어에 대한인덱스 값 입니다. 파이썬으로 해당 언어의 로케일을 구해오는 것은 다음과 같습니다. 어느 분께는 도움이 되셨기를 ..

[Windows] 디스플레이 배율에 관한 고찰

지훈현서|2020년 7월 11일

다른 리눅스나 맥도 마찬가지 이지만,화면(디스플레이)의 두 가지 보여주는 인자가 존재하는데 하나는 해상도이고 다른 하나는 배율(스케일)에관한 것입니다. 해상도야 그래픽카드와 모니터에 따라 지원되는 최대 해상도에서더 작은 것으로 선택을 하면 됩니다만, 요즘처럼 FHD 보다 큰해상도에서는 맥에서 이야기하는 레티나처럼 지원되지 위해서는윈도우에서는 배율을 100% 보다 크게 하여 해상도가 크더라도보여지는 것은 더 알맞고 이쁘게 보여지게 됩니다. 그런데 필요에 따라 이 배율을 프로그램으로 가져와야 하는데,이것을 딱 가져오게 하는 것이 나오지 않더군요.. 약간의 시행착오를 거쳐 알아낸 방법은, 만약 위와 같이 150%로 설정을 한 경우에는, 레지스트리에서 "컴퓨터\HKEY_CURRENT_USER\Control