반응형 python7 [Python + Ollama] API 키 없이 PDF 요약 자동화 스크립트 왜 만들었나PDF 자료가 계속 쌓인다. 논문, 기술 문서, 보고서. 읽어야 한다는 건 알지만 매번 열어서 끝까지 읽기가 쉽지 않다.자동으로 요약해주면 된다. OpenAI API로 하면 간단하다. 하지만 문서 수가 많아지면 토큰 비용이 쌓인다. 100페이지짜리 PDF 10개면 꽤 나온다.Ollama를 쓰면 무료다. 로컬에서 LLM을 실행하기 때문에 API 키도 없고 외부 전송도 없다. GPU가 없어도 CPU로 돌아간다. 느리지만 공짜다.필요한 건 딱 세 가지였다. PDF에서 텍스트 추출, 텍스트를 LLM에 넘겨 요약, 결과를 Markdown으로 저장. 이걸 CLI 스크립트 하나로 만들었다.기술 상세전체 흐름CLI 실행 → PDF 파일 스캔 (디렉토리 순회) → 텍스트 추출 (PyMuPDF) → 청킹 .. 2026. 3. 5. [Python] Telegram 봇 만들기 — 명령어, 날씨 API, 인라인 버튼, 메모 왜 만들었나알림, 날씨 확인, 간단한 메모처럼 반복적으로 하는 작업이 있다. 이걸 Telegram 봇으로 만들면 폰에서 채팅 한 줄로 처리된다. 별도 앱 없이도 되고, 서버가 있으면 24시간 돌릴 수도 있다.python-telegram-bot은 Telegram Bot API의 Python 래퍼다. v20부터 완전한 async/await 구조로 바뀌었고, 명령어 핸들러부터 인라인 버튼까지 필요한 기능이 모두 갖춰져 있다.앱 구조24-python-telegram-bot/├── main.py # 봇 메인 스크립트├── requirements.txt # python-telegram-bot, python-dotenv, httpx└── .env # BOT_TOKEN=your_t.. 2026. 3. 4. [Python] FastAPI로 REST API 서버 만들기 — Pydantic, CRUD, 자동 문서화 왜 FastAPI인가Python 백엔드 프레임워크 하면 Flask나 Django가 먼저 떠오른다. FastAPI는 2019년에 등장했지만 이미 Star 수에서 Flask를 앞질렀다. 이유는 세 가지다.첫째, 빠르다. Starlette + uvicorn 기반 비동기 서버라 Node.js, Go 수준의 처리량이 나온다. 둘째, 타입 힌트 기반 자동 검증이다. Pydantic 모델을 정의하면 요청 파싱, 유효성 검사, 에러 메시지가 자동으로 처리된다. 셋째, 자동 문서화다. 코드를 작성하면 /docs에서 Swagger UI가 즉시 열린다.Flask와 비교하면:항목FlaskFastAPI성능WSGI (동기)ASGI (비동기)입력 검증직접 구현Pydantic 자동 처리문서화별도 설정/docs 자동 생성타입 힌트선택.. 2026. 3. 4. [Python] BeautifulSoup으로 웹 스크래퍼 만들기 — 파싱, 페이지네이션, CSV 저장 왜 만들었나웹에 있는 데이터를 자동으로 수집하고 싶을 때 웹 스크래핑을 쓴다. 가격 비교, 뉴스 수집, 상품 모니터링 등 반복적인 데이터 수집 작업을 자동화할 수 있다.Python에서 웹 스크래핑의 표준 조합은 requests + BeautifulSoup이다. requests로 HTML을 가져오고, BeautifulSoup으로 원하는 데이터를 추출한다.이번 튜토리얼은 스크래핑 연습용으로 만들어진 books.toscrape.com을 대상으로 한다. 책 제목, 가격, 평점, 재고 정보를 5페이지 분량(100권) 수집해서 CSV로 저장한다.앱 구조22-python-scraper/├── main.py # 스크래퍼 스크립트├── requirements.txt # requests, beautiful.. 2026. 3. 4. [Python] openpyxl로 엑셀 보고서 자동 생성하기 — 스타일링, 수식, 차트까지 왜 만들었나매달 반복되는 엑셀 보고서 작업이 있다. 데이터 붙여넣기, 수식 입력, 셀 색칠, 차트 삽입. 할 때마다 30분씩 날아간다. 이걸 파이썬으로 자동화하면 클릭 한 번으로 끝난다.openpyxl은 파이썬에서 .xlsx 파일을 읽고 쓸 수 있는 라이브러리다. 셀 값 입력부터 스타일링, 수식, 차트까지 엑셀에서 할 수 있는 거의 모든 것을 코드로 처리할 수 있다.이번 튜토리얼에서 만드는 건 월별 매출 보고서 자동 생성 스크립트다. 12개월 판매 데이터를 받아서 스타일이 적용된 엑셀 파일을 자동으로 만든다.앱 구조21-python-excel/├── main.py # 보고서 생성 스크립트├── requirements.txt # openpyxl==3.1.5└── o.. 2026. 3. 3. [Python] 유튜브 자막 추출기 만들기 유튜브 자막 추출기 — Python으로 만들기왜 만들었나유튜브 영상 내용을 텍스트로 뽑아야 할 때가 있다. 강의 요약, 번역, AI 분석 등 용도가 다양하다. youtube-transcript-api 라이브러리를 쓰면 YouTube Data API 키 없이 자막을 바로 가져올 수 있다. 여기에 CLI 인터페이스를 붙여서 실용적인 스크립트로 만들었다.구현 기능:YouTube URL 또는 Video ID로 자막 추출언어 우선순위 지정 (기본: 한국어 → 영어)타임스탬프 포함/미포함 선택파일 저장 또는 터미널 출력사용 가능한 자막 언어 목록 확인기술 상세youtube-transcript-apiYouTube의 자막 요청은 공개 엔드포인트를 통해 이루어진다. youtube-transcript-api는 이 과정을 .. 2026. 2. 28. 이전 1 2 다음 반응형