본문 바로가기

분류 전체보기

(379)
ETL 최초 작성일: 2024년 1월 2일 최종 작성일: 2024년 1월 2일 목표: Data Service라는 솔루션 이해 ETL을 알아보게 된 계기는, SAP 내부적으로 Data Integration을 사용하지만, 외부의 데이터와 ETL( 혹은 ELT)을 위해서는 'Data Services'라는 제품이 있음. 생긴 모습은 'Data Stage 7.xx 버전'의 짝퉁 같은 느낌임. SAP Connector 라이브러리를 사용하여 SAP와의 궁합은 맞을 듯 하나 원천 DB와의 궁합이 의문. ETL 이란, ETL(추출, 전환, 적재)는 다양한 소스의 테이터를 데이터 웨어하우스라고 부르는데, 대형 중앙 집중식 Repository*에 결합하는 과정 임. ETL은 원시 데이터를 정리 및 구성해서 스토리지, 데이터 분석,..
JSON 최초 작성일: 2023-12-19 최종 작성일: 2023-12-19 목표: JSON 이해하기 JSON(JavaScript Object Notation) REST API는 프론트 엔드에게 데이터를 제공하기 위한 백엔드 시스템에 있는 창구임. 데이터를 주고 받는 것인데, 데이터를 어떤 양식에 맞춰 보내겠다고 약속하지 않으면, 주고 받기 어려울 수 있음. (예를 들어 어느 쪽에서는 데이터를 한글 파일에 적어서 보내주고, 어느 쪽에서는 데이터를 PPT 파일로 보내주면 양쪽에서 주고 받기 어려움. { id : 'abc', age: 3, photo: 'image.png' }
Rest API 최초 작성일: 2023년 12월 19일 최종 작성일: 2023년 12월 19일 목표: API 및 Rest API에 대해서 이해하기 API: Appication Program Interface system과 Client(응용프로그램)을 연결하는 시스템 은행이라는 거대한 시스템을 이용하는 고객(클라이언트)이 있으며, 고객과 시스템 사이를 연결해주는 창구가 바로 은행원(API)임. 결국 어떤 프로그램들은 시스템의 기능,자원,서비스를 사용하고 싶어하며, 해당 시스템이 만들어 놓은 서비스 창구를 API라고 할 수 있음. 어떤 모바일 게임이 카카오톡으로 로그인을 할 수 있도록 해 놓았다면, 그 모바일 게임은 카카오톡이라는 시스템의 로그인 기능을 사용하기 위해 카카오 톡이 만들어 놓은 로그인 API를 사용한것. RE..
정규표현식 최초 작성일: 2023.12.18 최종 작성일: 2023.12.18 목표: 정규 표현식 이해하기 (분류 추천 모델 장표 작성을 위해) 정규표현식 문자열을 조작하고 검색하기 위한 도구. 특정 패턴의 문자열을 식별하고 추출하는 데 사용함. 문자열 검색,교체,유효성 검사 등에 활용 활용영역 1. 패턴 매치 기능: 특정한 패턴과 일치하는 문자열을 찾는 패턴 매치 기능을 제공함. 이를 사용하여 문자열에 대한 검색 작업을 수행하거나, 원하는 문자열을 추출할 수 있음. 예를 들어, 이메일 주소 형식이나 전화번호 형식과 같은 특정한 패턴을 가진 문자열을 찾을 수 있음. 2.메타문자 사용: 정규표현식은 다양한 메타문자를 사용하여 패턴을 표한할 수 있음. 예를 들어, 정규 표현식에서 "^"는 문자열의 시작을 의미함.이러한..
OCR프로젝트_2 최초 작성일: 2023년 12월 10일 최종 작성일: 목표: 프로젝트에 산출물로 도면에서 필요 정보를 웹 페이지로 뿌리기 1.Dash Code 기본 형식 1.1 Dash 모듈 불러오기 Import dash 1.2 APP 객체 생성 app = dash.Dash() 1.3 APP 레이아웃 설정 app.layout = html.Div(...) 1.4 APP 실행 if_name_=='_main_': app.run_server[] 2.Dash-html-components -> 틀을 설정하는 기능 3. Dash-core-components -> 고급기능
I/F 정의서 최초 작성일: 2023-12-04 최종 작성일: 목표: I/F 정의서에 대해서 이해하고 혼자 작성할 수 있는 상태까지 만들어보자 구조는 1 통신 방식(Sync/Async) Source 시스템 I/F Protocol Target System 비고 I/F해야할 시스템명 Sync / Async PROXY 수신/배포 여기서 I/F Protocol에 대해서 이해 요망 프록시 (naver.com)
[Challenge01.]Tesseract(OCR)_extract_image 최초 작성일:23년 12월 3일 최종 작성일: 목표: 도면에서 특정 위치의 이미지 추출하기 pip install pdf2image import io import pytesseract from pdf2image import convert_from_path def extract_text_from_pdf('/Users/hongminji/Desktop/pdf/sample.pdf'): pages = convert_from_path('/Users/hongminji/Desktop/pdf/sample.pdf',500) pip install opencv-python import numpy as np from pytesseract import Output import pytesseract from PIL import Im..
[Day01.]SSMS살펴보기 최초작성일: 2023-11-26 최종작성일: 목표: DB생성해서 데이터 연결하기 1. 데이터 베이스 생성 2.SQL 서버 연결