본문 바로가기

Study

(8)
[용어] temperature, top_p temperature출력의 다양성(무작위성) 조절 값값의 범위: 0.0 ~ 2.0 (실사용은 주로 0~1)역할: 다음 토큰 선택 시 확률 분포를 얼마나 퍼뜨릴지 결정값특징적합한 상황0완전 결정적 (항상 같은 답)분류, 요약, 코드 생성0.3 ~ 0.7적당한 창의성마케팅 문구, 문체 변환1.0 초과매우 랜덤하고 창의적시, 소설, 브레인스토밍 낮으면 로봇처럼, 높으면 예술가처럼 top_p (nucleus sampling)확률 누적 상위 p 안에서만 후보 선택값의 범위: 0.0 ~ 1.0역할: 다음 단어 후보를 확률 높은 순으로 정렬 후, 누적 확률이 p에 도달하면 나머지는 제거. 그 안에서 무작위 선택값특징효과1.0제한 없음 (모든 후보 고려)기본값0.8상위 80% 확률만 고려좀 더 보수적0.5매우 제한적..
[지표]LLM 평가지표 -Confusion Matrix 과 F1 LLM의 성능을 평가하는데 사용하는 지표 Confusion Matrix예측 (Positive Negative)예측결과 (True False)실제 / 예측예측 긍정예측 부정실제 긍정TP (True Positive)FN (False Negative)실제 부정FP (False Positive)TN (True Negative) Accuracy (정확도) : 모델이 전체 예측 중 몇 %를 맞췄나? Precision (정밀도) : 예측한 것 중, 실제로 맞은 비중은 몇 % 인가? 전체 예측중 맞은거Recall (재현율) : 실제 맞아야 할 것 중, 예측한 비중은 몇 %인가? 개념값의 범위값이 높을수록?계산식exPrecision 정밀도0~1모델이 “맞다”라고 한 것 중 실제로 맞은 비율이 크다 → 거짓 경보(FP) ..
[AI] LangChain 랭체인 기본 개념LangChain은 LLM을 활용한 AI 서비스 구현을 위한 핵심 프레임워크함께 사용되는 LangGraph와 LangSmith를 통해 기능 연결, 흐름 설계, 성능 개선까지 전체 파이프라인을 구성 도구역할 설명예시LangChain기능 구현 – 개별 작업을 할 수 있는 도구메일 읽기, 분류하기, 답장 작성하기 등LangGraph흐름 설계 (워크플로우 구성) – 어떤 순서로 기능을 쓸지 지정① 메일 분류 → ② 특정 조건에 답장LangSmith모니터링 & 분석 – 실행 로그 기록, 성능 분석, 개선 포인트 찾기하루 메일 처리량, 분류 정확도, 응답 시간 분석 등 예를들면, 유저가 "오늘 온 메일 확인해줘"라고 요청할때LangChain → 메일 가져오기, 분류하기, 요약하기 기능 실행LangGra..
[etc] 가상환경에서 jupyter lab 실행하기 로컬에서 UV를 활용해 가상환경을 만들어 로컬환경과 분리하고자 함*uv는 Python 가상환경(virtual environment)을 빠르고 가볍게 만들어주는 도구 1. 터미널 실행- iTerms2 : https://iterm2.com/ 2. 가상공간 만들기 - uv 설치하기# uv 설치파일 가지고오기curl -LsSf https://astral.sh/uv/install.sh | sh# uv 설치하기 source $HOME/.local/bin/env curl : URL로부터 데이터를 받아오는 명령어-L : 리다이렉트 따라가기 (https → http 등)-sS : 출력 생략(-s) + 실패시 에러 보이기(-S)-f : 실패 시 에러 반환- https://astral.sh/uv/install.sh : u..
[AI] AI 개념 AI 란?: 인간의 지능을 모방한 기술 AI는 어떻게 작동하나? 데이터 수집·정제학습(Training) – 머신러닝·딥러닝으로 패턴과 파라미터를 최적화추론(Inference) – 새 입력에 대해 예측·결정을 수행배치·상호작용 – 예측 결과를 앱·로봇·챗봇 등에 적용해 행동‧응답 AI vs 알고리즘항목알고리즘AI정의명확한 입력 → 명확한 출력으로 가는 절차적 규칙데이터에서 패턴을 학습하고, 스스로 판단지식사람이 규칙을 "코딩"해서 넣음스스로 학습해서 규칙을 "발견"함변화 대응고정적 (변화에 약함)적응 가능 (데이터로 재학습 가능)출력언제나 같은 입력이면 같은 결과같은 입력이라도 상황에 따라 달라질 수 있음중심 기술논리, 수학적 절차확률, 통계, 머신러닝, 뉴럴 네트워크예시정렬 알고리즘(버블, 퀵), ..
[지표] AARRR 프레임워크: 프로덕트 성장을 위한 핵심 지표 AARRR : 사용자의 행동을 분석하고 최적화 하는 퍼널(Funnel) 모델 Acquisition (획득): 고객이 우리 서비스에 처음 유입되는 단계 | 방문 - 처음 들어옴Activation (활성화): 고객이 제품이나 서비스를 처음으로 의미 있게 사용하는 단계 | 체험 - 처음 들어옴Retention (유지): 고객이 지속적으로 서비스를 이용하는 단계 | 재방문 - 계속 쓰러 돌아옴Revenue (수익화): 고객이 돈을 지불하는 단계 | 결제 - 돈을 지불함Referral (추천): 기존 고객이 새로운 고객을 초대하는 단계 | 추천 - 친구들에게 입소문 냄[1] Acquisition (획득): 고객이 처음 우리 서비스에 유입되는 단계 의미사용자가 검색, 광고, SNS, 추천 등을 통..
[지표] 설정한 지표의 유의미함 : p value 취소율이 2%에서 1%로 줄어들었다 이 문장만 가지고는 유의미한 변화가 있는건지 아닌지 판단할 수 없음단순히 우연에 의한건지, 실제 의미있는 변화인지 판단하기 위해 p value를 활용하고자 함 1. 가설 설정귀무 가설 (H₀): 취소율의 변화가 우연에 의한 것이며, 실질적인 차이가 없다. 즉, 2%에서 1%로 줄어든 변화가 의미가 없다고 가정대립 가설 (H₁): 취소율의 변화가 우연이 아니며, 실제로 의미 있는 차이가 있다는 가설 2. 통계적 검정 방법 선택두 비율의 차이를 비교할때, 각 비율의 표본크기가 충분히 클 때z-검정 (Two-proportion z-test) 방법 사용 [More about 표본의 크기]표본 크기(N)가 클수록 작은 변화도 유의미할 가능성이 커짐통계적으로 충분히 큰 표본 ..
[개념] PG / VAN / 간편결제의 관계 - VAN(Value Added Network) : 가맹점 대신 여러 카드사와 계약, 가맹점은 van사 하나랑만 계약가능- PG(Payment Gateway) : VAN사는 오프라인 결제에 최적화, VAN사와 온라인 가맹점들의 온라인 통로- 간편결제 : PG사의 결제 프로세스 단축 1. 오프라인 결제프로세스고객이 매장에서 상품이나 서비스를 구매하고 카드로 결제결제 정보는 단말기를 통해 VAN사로 전달VAN사는 결제 승인 요청을 카드사로 전송카드사는 승인 여부를 결정해 VAN사로 전달VAN사에서 단말기로 결과 반환고객 결제 완료 수수료 구조가맹점 수수료: 약 1.5%~2.5%가맹점 ➔ 카드사에 지급VAN사 수수료: 정액제(건당 약 100원~130원) ➔ 정률제카드사 ➔ VAN사에 지급https://www...