(SAS) SAS 실습 #1 - 기초

이미지
  SAS 실습 #1 - 기초 ※ wikidocs SAS (https://wikidocs.net/book/2678) 를 실습한 내용임    1. 라이브러리와 테이블 생성     - 테이블 : 엑셀과 같이 행과 열로 데이터가 정리된 파일명     - 라이브러리 : 테이블이 속한 폴더명 (테이블이 저장된 폴더라고 생각하면 됨)     - 라이브러리를 특별히 설정하지 않는다면 기본 라이브러리로 'WORK' 라이브러리가 설정됨   <명령어>    - data xxx :  테이블을 생성하는 명령어    - set yyy : 테이블을 불러오는 명령어    - run : 코딩의 끝을 알려주는 명령어. 이 명령어가 들어가야 SAS가 전체 코딩이 끝난것을 인식하고 명령어 시행    - ';' : 각 명령어 문장의 끝을 알려주는 명령어. 문장 코딩이 끝난 것을 알려줌.    - ' ' (스페이스 공간) : 명령어 구분. 스페이스가 여러 개여도 관계가 없다.    - /* */ : 주석. 코드 실행에 영향을 미치지 않음    - 라이브러리 명령어는 '라이브러리.테이블명'으로 실행       ex) 'SASHELP.CLASS'  -> SASHELP가 라이브러리 명, CLASS가 테이블명    -  생성된 테이블 앞에 라이브러리를 지정하지 않는 경우 자동으로 WORK 라이브러리에 테이블을 저장        하지만 SAS를 종료하면 사라지기 때문에 반드시 라이브러리를 생성해서 저장해야 함.   - *SAS는 대문자와 소문자를 구별하지 않음   - 코드 작성 후 실행할 코드 블록 지정 후 F3 누르면 전체 실행   - 코드가 잘 ...

(Tableau) 태블로 실습 #3 : 서울시 아파트 실거래가 공공데이터 활용 차트 작성

이미지
   Tableau Practice #3 태블로 실습 #3 2020년 서울시 아파트 실거래가 공공데이터 활용 차트 작성  - 총 4개 차트 작성하여 대시보드 구성 월별 평균 거래금액 및 총 거래건수 : 막대차트와 라인 차트 결합. 참조선을 통한 평균 표시  동별 평균 거래 금액 : 트리맵 활용 (평균 거래금액 상위 20위까지만 표시) 면적별, 건축연도별 평균 거래금액 : 원 차트 활용, 거래금액에 따른 색상 및 크기 변화 평균 거래 금액 Top 10 단지 : 표 차트 작성 (순위 퀵테이블 계산, 필터 컨텍스트 지정) - 강남구로 필터링해서 본 거래 현황 대시보드 완성본    주요 2개 차트를 보자면,   20년 서울시 전체 월별 아파트 평균 실거래 금액이 가파르게 우상향한 것을 볼 수 있다. 그리고 거래건수가 6~7월에 집중 되어 있는데, 정부의 6/17, 7/10 부동산 대책이 오히려 역효과를 내면서 패닉 바잉이 증가한 것이 원인으로 보인다.   면적별, 건축연도별 평균 거래 가격을 보면, 당연히 면적이 클수록 거래 가격은 우상향 한다. 다만 건축연도를 기준으로 보면 10~30년 이내 구간에서는 신축일 수록 가격이 증가하는 경향이 있으나 오히려 40~50년 아파트 거래 가격이 훨씬 높은 것을 볼 수 있다. 알고보니 강남에 압구정 현대 아파트를 비롯한 70년대에 지어진 아파트들의 거래 가격이 높은 것이 해당 건축연도의 전체 평균 가격을 높이는 원인이었다.  부동산 거래 공공데이터는 양이 워낙 방대해 내려 받는데 시간이 오래 걸려 서울시에 한해 20년 자료만 활용할 수 밖에 없어 전년 비교를 못한 점이 아쉽지만, 20년 한해 가장 이슈가 많이 되었던 사안을 데이터로 시각화해보며 다시금 현상을 들여다 볼 수 있었다는 점에서 의의가 있었던 실습이었다. 

(Tableau) 태블로 실습 #2 : 국가별 수출입실적 차트 작성_ 도넛차트 만들기

이미지
 Tableau Practice #2 태블로 실습 #2 국가별 수출입 실적 데이터로 도넛 차트 만들기 - 매개변수 활용하여 특정 국가 선택시 연도별 전체 수출 or 수입 금액 중 해당 국가가 차지하는 비중 및 실적으로 자동 변환  - 비중 부분을 도넛 차트로 시각화   <완성 결과물>

(Tableau) 태블로 실습 #1-2 : 국가별 수출입실적 차트 작성_ 이중 막대 그래프 작성하기

이미지
  Tableau Practice #1 태블로 실습 #1 국가별 수출입실적 데이터를 이용한 이중 막대 그래프 작성하기 Part 4. 무역수지 상위 N개 국가 막대 그래프 작성하기 - '행' 선반에 '국가명', '열' 선반에 'C_무역수지(선택연도)', 'C_무역수지(이전연도)' 를 마우스로 드래그해서 놓기.  - 시트 상에 나오는 국가의 수를 제한하기 위해 매개 변수 생성 - 매개 변수가 실제로 다른 차원값들과 연동하여 작동하기 위한 설정필요 - 테이블에 있는 '국가명' 차원값을 마우스 오른쪽 버튼 클릭한 채 '필터' 상자로 드래그.   → 필터' 창의 '상위' 탭에서 '필드기준' 선택   → 상위 값을 직접 입력대신 생성한 매개변수 'P_Top N' 선택 - '적용' 후 '확인' 누르면 매개 변수 값에 따라 아래과 같이 제한된 국가만 표시 - 현재 두개의 막대 그래프로 나누어진 선택연도 무역수지와 이전연도 무역수지 그래프를 하나로 합치기  → '열' 선반의 '무역수지_이전연도' 값 클릭하여 '이중 축' 선택 - '이중 축' 설정하면 아래와 같이 두 그래프가 합쳐지는 것 확인 가능 - 두 그래프가 합쳐져 축 값이 상이한 것을 맞춰주기 위해 '축 동기화' 사용   (두 축 중 하나 선택하여 마우스 오른쪽 클릭, '축 동기화' 선택)  - 선택연도 무역수지 막대그래프가 값에 따라 그라데이션으로 색상을 보여지게 하기 →  'C_무역수지(선택연도)' 차원값을 해당 마크 선반의 '색상'으로 드래그하면 아래와 같이 자동으로 그라데이션 색상 적용 - 전체 뷰를 '표준' 값에서 '전체 보기' 로 변경하여 그래프 크기 키우기 - 선택연도 무역수지 그래프를 강조...

(Tableau) 태블로 실습 #1-1 : 국가별 수출입실적 차트 작성_ 데이터 연결 및 전처리, 카드 차트 작성하기

이미지
Tableau Practice #1 태블로 실습 #1 사용 데이터 :  국가별 수출입실적 (2018~2019, 전 국가 대상) 출처 : 관세청 수출입 무역 통계           (https://unipass.customs.go.kr/ets/index.do?menuId=ETS_MNU_00000113)  - 2019,2020년에 국가별 무역수지, 수출, 수입 실적을 보기 위한 차트 - 매개변수를 활용하여 연도별 총 실적, 전년비 신장율 자동 산출 - 매개변수 활용하여 무역수지 상하위 N개 국가 자동산출 - 막대 그래프에서 선택연도와 이전연도 실적을 동시에 표기 - 선택연도에는 실적에 따른 색깔 그라데이션 적용, 이전연도 실적은 비교를 위한 단일 색상(회색) 적용 <완성 결과물_1> <완성 결과물_2> Part 1. 데이터 원본 연결 및 전처리 - 태블로 실행 후 '파일에 연결' → 'Microsoft Excel' 선택 - 사용하고자 하는 엑셀 파일 불러오면 아래와 같이 태블로에 데이터 원본 연결  ※ .xlsx 파일 형식의 경우 .xls 형식으로 재 저장을 해야만 정상적으로 데이터 연결 가능. - '시트1'로 이동하면 아래와 같이 왼쪽에 테이블 key값 생성되었음을 확인 가능    - 데이터 원본에서 수치에 해당되는 데이터 값들의 유형을 '문자열' → '숫자(실수)' 타입, '차원' 에서 '측정값'으로 변환 ※ 변환 대상 : 무역수지, 수입건수, 수입금액, 수출건수, 수출금액 ※ '연도' 의 경우에는 '데이터 유형 변경'에서 '날짜'로 변경 Part 2. 차트 목적에 맞는 변수 생성 본 차트는 선택한 연도에 따라 자동으로 차트가 변경되도록 하는 것이 핵심이므로, 매개변수 및 계산된 필드를 사용. - 매개 변수 만들기 선택 - 이름을 'P_선택연도'로 설정 - 허용 가능한 값을 '...