Python
-
Jenkins pipeline 만들어서 배포하기(Python FastAPI 배포 환경 구축 - 2)Programming/Jenkins 2022. 7. 31. 19:27
2022.07.29 - [Programming/Jenkins] - Jenkins Docker-compose로 시작하기 (Python FastAPI 배포 환경 구축 - 1) Jenkins Docker-compose로 시작하기 (Python FastAPI 배포 환경 구축 - 1) jenkins란? https://ict-nroo.tistory.com/31 [Jenkins] 젠킨스란 무엇인가 What is jenkins? 젠킨스는 소프트웨어 개발 시 지속적으로 통합 서비스를 제공하는 툴이다. CI(Continuous Integration) 툴 이라고 표.. datacook.tistory.com git https://github.com/Joonyeong97/fastapi GitHub - Joonyeong97/fa..
-
Python argparse 사용하기! (터미널에서 python을 실행할 때, 옵션을 쉽게주자)Programming/Python 2021. 5. 28. 11:36
import argparse def arg_test(opt): p1 = opt.test_a p2 = opt.test_b p3 = opt.test_c print(p1,p2,p3) if __name__ == '__main__': parser = argparse.ArgumentParser() parser.add_argument('--test-a', type=str, default='good1', help='argument 1') parser.add_argument('--test-b', type=str, default='good2', help='argument 2') parser.add_argument('--test-c', type=str, default='good3', help='argument 3') opt..
-
[matplotlib]플롯의 특정 부분만 색상 변경하기Programming/Python 2021. 4. 6. 16:15
혼자서 upbit의 코인들을 예측하고 있는 프로젝트가 있는데, 예측 결과를 색상으로 다르게 표현하고 싶어서 찾아보다가 유용해서 퍼왔습니다. 응용도 조금 섞었습니다. from matplotlib import pyplot as plt import numpy as np # X,y 선언 y = np.array([2,5,7,8,13,14,13,12,10,5,2]) x = np.arange(len(y)) # 생성 제외할 값의 기준 threshold = 10 # line plot plt.plot(x, y, color='blue') below_threshold = y < threshold # Add above threshold markers above_threshold = np.logical_not(below_thre..
-
(로컬)Python에서 Google Drive 공유파일 다운로드 받는 방법Programming/Python 2021. 4. 2. 18:18
Jupyter notebook에서는 Anaconda prompt를 이용해서 pip install gdown 설치 진행 import gdown google_path = 'https://drive.google.com/uc?id=' file_id = '1Of_X6StezV0vwE0WrQ7MNbIFjITkW4dJ' output_name = 'animals_images.zip' gdown.download(google_path+file_id,output_name,quiet=False) 드라이브 파일이 공유되어있다는 가정하에 링크를 복사하면 뒤에 파일 아이디가 붙습니다. 뒤에 있는 아이디만 잘라내서 작성하면 다운로드가 됩니다. 사용시 google_path는 냅두고 file_id만 수정하시면 됩니다. output_na..
-
데이터과학을 위한 통계 리뷰 - 14일차 (회귀분석2,교차타당성검사,k-fold,단계적 회귀분석,후진적 제거,전진적 선택,단계적 선택,RidgeMachine Learning/데이터과학을 위한 통계 2021. 3. 14. 20:49
4.2.3 교차타당성검사단순선형회귀란? 한 변수와 또 다른 변수의 크기 사이의 어떤 관계가 있는지 보여주는 것 k-fold 란?- K개의 fold를 만들어서 교차검증을 진행Train set/Test set을 나눠서 학습과 검증을 진행하고, 번갈아가면서 학습셋이 테스트셋이 되면서 과적합을 방지하기 위함 데이터의 갯수가 적어도 정확도를 향상시킬 수 있습니다. Iris 데이터와 최근접 이웃(KNeighbors)을 사용하고,K-fold 를 이용해서 데이터를 학습하는 과정 단일 관측지 제거 방식 LOOCV는 n개의 데이터에서 1개를 Test Set으로 정하고 나머지 n-1개의 데이터로 모델링을 하는 방법을 의미합니다. LOOCV 방법은 데이터 수 즉, n이 크다면, n번의 모델링을 진행해야함시간이 오래 소요됨회귀..
-
사이킷런(sklearn)을 이용한 머신러닝 - 4 (분류)Machine Learning 2021. 3. 13. 23:40
사이킷런의 traintrain_test_split이란? model select 전처리에 편하게 나눠서 처리할수 있게 도와주는것. feature 기본적인 머신러닝의 절차 -preprocessing 전처리 -> learning -> model -> predict service 4차 산업시대 IOT (모든장비를 인터넷으로 묶은것) Bigdata AI AR(증강현실)/VR(가상현실)/MR(증강+가상) fintech BlockChain 가장현실적인 것 AIOT (AI + IOT) 신경망 -Tensorflow -> ANN -> FFNN(feed forword) -> MLP(Multi-layer-Perceptron) XOR문제를 해결을 못해서 -> Multi layer -> 기울기소멸 -> LSTM preproces..
-
사이킷런(sklearn)을 이용한 머신러닝 - 3 (군집,분류)Machine Learning 2021. 3. 12. 12:27
군집을 이해하기 앞서서, 벡터를 이미지를 통해서 이해하시면 편합니다. %matplotlib inline import matplotlib.pyplot as plt import seaborn as sns; sns.set() import numpy as np # 이미지를 파일로 출력하고 로딩한다음 글씨만 추출 def make_hello(N=1000, rseed=42): fig, ax = plt.subplots(figsize=(4, 1)) fig.subplots_adjust(left=0, right=1, bottom=0, top=1) ax.axis('off') ax.text(0.5, 0.4, 'HELLO', va='center', ha='center', weight='bold', size=85) fig.save..
-
데이터과학을 위한 통계 리뷰 - 12일차 (복습과정,예제문제,분포)Machine Learning/데이터과학을 위한 통계 2021. 3. 12. 11:35
실제 p값 구하기 모의 실험 - 1 1개 표본 : 동전을 80번 돌렸을 때 앞면이 나올 확률 -> 125개 표본 추출 모의 실험 - 2 F통계량 예제 (ANOVA (ANalysis Of VAriance; 분산 분석)분산분석 3가지 조건정규성 : 각각의 그룹에서 변인은 정규분포.분산의 동질성 : Y의 모집단 분산은 각각의 모집단에서 동일.관찰의 독립성: 각각의 모집단에서 크기가 각각인 표본들이 독립적으로 표집. 파이썬에서 One-way ANOVA 분석은 scipy.stats이나 statsmodel 라이브러리를 이용해서 할 수 있습니다. 일원분산분석(One-way ANOVA)종속변인은 1개이며, 독립변인의 집단도 1개인 경우. 한가지 변수의 변화가 결과 변수에 미치는 영향을 보기 위해 사용됩니다. 22명의 ..