본문 바로가기

#단편모음/개념 ( 이해와 정리 )5

[결측 데이터의 종류] MCAR, MAR, NMAR 2024-03-17 직접제작✍️ 2024. 3. 17.
[프라이버시 모델] k-익명성 → l-다양성 → t-근접성 (개인정보 비식별 조치) 2024-03-17 직접제작✍️ 그림(동일내용) 더보기 비식별 기술 (프라이버시 모델) ☑발전과정 k-익명성 → l-다양성 → t-근접성 강의링크 https://www.youtube.com/watch?v=hPcGvFcbl80 기법 의미 적용 예 취약점, 취약점원인 1. k-익명성 특정인임을 추론할 수 있는지 여부를 검토, 일정 확률수준 이상 비식별 되도록 함 동일한 값을 가진 레코드를 k개 이상으로 함. 이 경우 특정 개인을 식별할 확률은 1/k 임 [취약점] ⊙동질성 공격(Homogeneity Attack) ⊙배경지식에 의한 공격(Backgroud knowledge Attack) [취약점 원인] ⊙다양성의 부족(Lack of Diversity) ⊙강한 배경지식 (Strong Background Know.. 2024. 3. 17.
[기계학습과 종류] 지도학습, 비지도학습, 기계학습 adsp 문제 유형으로, 각 학습 섞어넣고 -학습이 아닌 것은 꼭 나온다. 2024-02-23 comment 답먼저 설정하고 - 거기에 잘 매칭하는 - 지도 학습. 답이 없고 - 그러기에 특징과 패턴으로 묶는 식으로 학습하는 - 비지도 학습. 목표지향적으로 - 좀 더 강화하는 - 강화학습. 출처 http://jidum.com/jidums/view.do?jidumId=1088 영상 https://www.youtube.com/watch?v=qJoqYKdDwKI 2024. 2. 23.
[분류 모델 성능 평가 지표] 오차행렬과 지표 2024-02-23 오차행렬 (Confusion Matrix) ※ comment 표 밖의 지표, 예측과 실제가 어디에 있는지,Positive 와 Negative 자리부터 잘 확인해야한다. 자격증별로, 사람마다 잘 쓰는 순서가 달라서 위치로 외워 버리면 헷갈리기 때문에 유의한다. 지표 읽는 방법 뒷자리 -> 앞자리 로 보는 것이 편하다. 내가 만든 모델이 P(긍정)으로/ N(부정)으로 예측했는데 ->그 값이 실제로 T(참, 맞았다.) / F(거짓, 틀렸다.) 앞자리 뒷자리 실제값 내가 만든 모델이 예측한 것 P(긍정) 1 N(부정) 0 T(참, 맞았다.) 1 F(거짓, 틀렸다.) 0 https://carriedata.tistory.com/entry/%EC%98%A4%EC%B0%A8-%ED%96%89%EB%.. 2024. 2. 23.
[척도] 명목척도 서열척도 등간척도 비율척도 2024-02-22 https://www.youtube.com/watch?v=nrVPnTWB3iA ✏️강의필기 연관규칙(association rule) | 척도 |명서등비| ①명명척도 {only =,naming } ②서열척도 =순위척도 {비교가능} = ① + 순서 ③등간척도 =동간척도 간격척도 구간척도 has 임의의 0점{비교, 산수가능} ② + 동일한 간격 ④비율척도 has 절대영점=찐없음(돈0원,거지){비교, 산수받고 곱셈 나눗셈도됨 ∴ 통계가능} 종류 포함정보 질적 척도 명목 척도 명목적 범주 = 서열 척도 순위가능 범주 = 순서 양적 척도 등간 척도 간격비교 범주 = 순서 상대적 크기 + - 비율 척도 사칙연산, 통계 범주 = 순서 상대적 크기 + - 절대적 크기 ×, ÷ 예제 풀이 https:/.. 2024. 2. 22.