📖
Simple & Clear Engineer Note
  • This is me
  • Infra 용어
  • Linux Acceptance test
    • ISO 9126의 특성에 따른 OS 항목 분류
    • 기능성 (Functionality)
      • Kernel 영역
      • LVM (Logical Volume Manager)
      • API (daemon 서비스 상태 체크)
      • CPU 정보 및 Firmware 확인
      • Memory 용량 및 Slot 확인
      • Negotiation 상태 확인
      • Raid 구성 확인
      • WEB/WAS 설치
      • Cache/Swap 메모리 초기화
      • NFS (Network File System)
    • 신뢰성 (Reliability)
      • Bonding
      • System Reboot
      • Disk Mirror
      • Multipath
      • Cluster
      • Backup & Optical Drive check
      • kdump
      • watchdogtimer
    • 사용성 (Usability)
      • Locale
      • Network 구성
      • Hosts file
      • DNS(Domain Name System)
      • NTP(Network Time Protocol) 시간 동기화
      • tcpdump
      • SSH (Secure Shell)
      • Runlevel
      • Crontab 작업 예약
      • TimeZone
      • VNC(Virtual Network Computing)
      • Yum local repository
    • 유지보수성 (Maintenance)
      • hdparm
    • 보안성 (Security)
      • Permission error 해결방법
    • 기타(ETC)
      • X window
      • Macro (Shell Script & TeraTerm(TTL))
  • Webserver
    • Infra Structure 소개
      • HTML +CSS +JavaScript
      • MongoDB + Flask
  • Hadoop Guide
    • Hadoop Single설치 (ver 2.7.4)
  • MachineLearning
    • 확률(Probability)
    • Machine learning이해하기
    • Processing Data(Numpy)
    • Data Handling - Pandas
      • feature Scaling
      • Data encoding
    • Analysis(with Python & R)
      • 기초통계지식
      • 회귀(Regression)
      • 분류(Classification)
      • 차원축소(Dimension Reduction)
      • 군집화(Clustering)
      • 평가(Evaluation)
      • Scikitlearn
    • Text Analysis
    • Time Series Analysis
    • Statistics
    • Customer Value Analysis
  • Deep Learning
    • CS231n
      • CS231n (Lecture 1~6)
      • CS231n(Lecture7~12)
  • DataBase
    • DataBase
    • Transaction
    • Oracle 12C setup
    • MySQL setup
    • neo4j Enterprise Setup
    • SQL
    • Data inquiry and data analysis using SQL
    • 품질 & RiskManagement
    • 성능(Performance)
    • 안정성
    • 이기종간 데이터 이관방법
  • 기타
    • JAVA용어정리(암기)
  • Windows 관리
    • WINDOW 서버 root 권한 설정 방법
    • 접속자 확인
  • EMRproject
    • Git & Github
Powered by GitBook
On this page
  • 결합확률과 조건부 확률
  • 독립
  • 베이즈 정리

Was this helpful?

  1. MachineLearning

확률(Probability)

PreviousHadoop Single설치 (ver 2.7.4)NextMachine learning이해하기

Last updated 3 years ago

Was this helpful?

시간이 없어 집합, 확률, 확률의 성질은 ㅓㄴ ㅇㅇ건너뛰고 베이지안 확률론 부터 설명하겠다.

베이지안 확률을 접하기 전 결합확률(marginal probabilty)과 조건부확률(conditional probability)를 알아야 한다.

결합확률과 조건부 확률

결합확률(joint probability)은 사건 AAA와 BBB가 동시에 발생할 확률이다. 즉, 사건(명제/주장) AAA도 진실이고 사건(명제/주장) B도 진실이므로 사건 A∩AA\cap AA∩A와 B\cap B의 교집합의 확률을 계산하는 것과 같다.

P(A∩B)orP(A,B)P(A∩B) or P(A,B) P(A∩B)orP(A,B)

결합확률과 대비되는 개념으로 결합되지 않는 개별 사건의 확률 P(A)P(A)P(A) 또는 P(B)P(B)P(B)를 주변확률(marginal probability)이라 한다.

또한 B가 사실일 경우의 사건 A에 대한 확률을 사건 B에 대한 사건 A의 조건부 확률(conditional probability)이라고 하며 다음과 같이 표기한다.

이 조건부 확률의 값은 다음처럼 정의될 수 있다.

독립

독립의 수학적 의미 는 사건 A와 사건 B의 결합확률의 값이 다음과 같은 관계가 성립할 때

두 사건 A와 B는 서로 독립(independent)이라고 정의한다.

독립인 경우 조건부확률과 원래의 확률이 같아짐을 알 수 있다. 이 때 B라는 사건이 발생여부에 관계없이 A에는 전혀 영향을 주지 않는 다는 것이다.

베이즈 정리

베이즈 정리는 데이터라는 조건이 주어졌을 때의 조건부확률을 구하는 공식이다. 베이즈 정리를 쓰면 데이터가 주어지기 전의 사전확률값이 데이터가 주어지면서 어떻게 변하는지 계산할 수 있다. 따라서 데이터가 주어지기 전에 이미 어느 정도 확률값을 예측하고 있을 때 이를 새로 수집한 데이터와 합쳐서 최종 결과에 반영할 수 있다. 데이터의 개수가 부족한 경우 아주 유용하다.