Skip to main content
PaddleOCR는 PaddlePaddle로 구현되어, 사용자가 더 나은 모델을 트레이닝하고 이를 실제에 적용할 수 있도록 돕는 다국어 지원의 뛰어나고 선도적이며 실용적인 OCR 도구를 만드는 것을 목표로 합니다. PaddleOCR은 OCR과 관련된 다양한 최첨단 알고리즘을 지원하며, 산업용 솔루션도 개발했습니다. 이제 PaddleOCR은 트레이닝 및 평가 메트릭과 해당 메타데이터가 포함된 모델 체크포인트를 로깅할 수 있는 W&B 인테그레이션도 제공합니다.

예시 블로그 & Colab

여기에서 확인하세요. ICDAR2015 데이터셋에서 PaddleOCR로 모델을 트레이닝하는 방법을 볼 수 있습니다. Google Colab도 함께 제공되며, 해당 실시간 W&B 대시보드는 여기에서 확인할 수 있습니다. 이 블로그의 중국어 버전도 있습니다: W&B对您的OCR模型进行训练和调试

가입하고 API 키 생성하기

API 키는 사용 중인 머신을 W&B에 인증합니다. 사용자 프로필에서 API 키를 생성할 수 있습니다.
더 간편하게 하려면 User Settings로 바로 이동해 API 키를 생성하세요. 새로 생성한 API 키는 즉시 복사해 비밀번호 관리자와 같은 안전한 위치에 저장하세요.
  1. 오른쪽 상단에서 사용자 프로필 아이콘을 클릭합니다.
  2. User Settings를 선택한 다음 API Keys 섹션까지 스크롤합니다.

wandb 라이브러리 설치 및 로그인

로컬 환경에 wandb 라이브러리를 설치하고 로그인하려면 다음 단계를 따르세요.
  1. WANDB_API_KEY 환경 변수를 API 키로 설정합니다.
    export WANDB_API_KEY=<your_api_key>
    
  2. wandb 라이브러리를 설치하고 로그인합니다.
    pip install wandb
    
    wandb login
    

config.yml 파일에 wandb 추가

PaddleOCR에서는 설정 변수를 yaml 파일로 지정해야 합니다. 설정 yaml 파일 끝에 다음 스니펫을 추가하면 모델 체크포인트와 함께 모든 트레이닝 및 검증 메트릭이 W&B 대시보드에 자동으로 로깅됩니다:
Global:
    use_wandb: True
wandb.init()에 추가로 전달하려는 선택 인수도 YAML 파일의 wandb 헤더 아래에 추가할 수 있습니다:
wandb:  
    project: CoolOCR  # (선택) wandb 프로젝트 이름입니다 
    entity: my_team   # (선택) wandb 팀을 사용하는 경우 여기에 팀 이름을 전달할 수 있습니다
    name: MyOCRModel  # (선택) wandb run의 이름입니다

config.yml 파일을 train.py에 전달하기

그런 다음 YAML 파일을 PaddleOCR 저장소에서 사용할 수 있는 트레이닝 스크립트의 인수로 전달합니다.
python tools/train.py -c config.yml
W&B를 활성화한 상태로 train.py 파일을 실행하면 W&B 대시보드로 이동할 수 있는 링크가 생성됩니다:
PaddleOCR 트레이닝 대시보드
PaddleOCR 검증 대시보드
텍스트 탐지 모델 대시보드

피드백 또는 문제

W&B 인테그레이션에 대한 피드백이 있거나 문제가 발생하면 PaddleOCR GitHub에 이슈를 등록하거나 support@wandb.com으로 이메일을 보내세요.