나라장터 공공 입찰

[입찰 프로젝트] 나라장터 입찰 사정률 분석, 공백 구간 찾기

카키스케치(KhakiSkech) 2025. 3. 17. 06:56

공백 구간 찾기로 낙찰률 높이는 전략 개발 #1

자사 입찰 분석 프로그램 (캡쳐)

1. 왜 필요한가? (프로젝트 필요성)

  1. 국내 공공 조달 시장의 규모
    • 나라장터(국가종합전자조달)를 통해 발주되는 공사·물품·용역의 규모는 연간 수십 조 원에 달합니다.
    • 사업자 입장에서는 낙찰 성공이 곧 매출·성장 기회로 이어집니다.
  2. 사정률(낙찰률) 예측의 어려움
    • 기존에는 ‘경험적 감’과 ‘동종 업계 네트워크’ 등을 통해 대략적인 사정률을 짐작해 왔습니다.
    • 그러나 업종·지역·공고 규모에 따라 사정률 변동폭이 크고, 업체별 전략에 따라 달라지므로 정확한 예측이 사실상 어려웠습니다.
  3. AI/머신러닝 기반 접근
    • 다행히, 나라장터 등에서 과거 공고와 낙찰 결과가 공개되기 때문에, 이를 수집·분석해 과거 패턴을 찾아볼 수 있습니다.
    • 머신러닝 모델을 적용하면, 업체별 투찰 습관, 지역·업종 특성, 공고 규모 등을 종합해 사정률을 예측하고, 경쟁자가 적은 구간(공백 구간)을 찾아낼 수 있습니다.
  4. 공백 구간 탐색의 가치
    • 여러 업체가 비슷한 사정률에 몰리면, 낙찰 가능성은 낮아지고 과열 경쟁이 발생합니다.
    • 반대로 아무도 써내지 않는 구간(공백)이 있다면, 그 지점에 투찰해 낙찰 확률을 높일 수 있습니다.
    • “사정률 공백 구간 찾기”는 기존 입찰 방식에 비해 낙찰 가능성을 획기적으로 높이는 핵심 전략이 될 수 있습니다.

2. 전체 구성(아키텍처 & 단계별 접근)

본 프로젝트에서는 과거 입찰 데이터 수집부터 머신러닝 모델 학습대시보드 시각화까지 단계별로 추진합니다.

자사 입찰 분석 노하우, 사정률에 대한 미세 분석 (캡쳐)

2.1. 데이터 수집 및 정제

  1. 나라장터 공고 & 낙찰 결과
    • 공고 정보(지역, 업종, 예정가격, 발주처 등) + 낙찰 결과(낙찰 업체, 낙찰 금액, 참여 업체 리스트 등)를 확보합니다.
    • 필요 시 API 연동, 웹 크롤러를 통해 자동 수집할 계획입니다.
  2. 데이터 전처리
    • 수집된 공고와 결과 정보 중 중복, 오류 데이터를 제거/수정.
    • “공고 ID”, “예정가격”, “낙찰가”, “투찰 업체 ID”, “투찰률” 등의 핵심 칼럼을 표준화합니다.
  3. 테이블/DB 설계
    • 공고 테이블(TENDER_NOTICE), 업체 테이블(COMPANY), 투찰 이력(BID_HISTORY) 등으로 구분 저장.
    • 사정률 제한 범위가 있는 공고(예: -2%~+2%) 정보도 함께 기록합니다.

2.2. 모델 설계 (사정률 예측 & 공백 구간 탐색)

  1. 사정률 예측 모델
    • (1) 지역 전체
    • (2) 지역 + 업종
    • (3) 지역 + 업종 + 유사 가격대
    • 이렇게 3단계로 세분화하여 회귀분석 혹은 트리계(랜덤포레스트, XGBoost 등) 모델을 적용할 계획입니다.
    • “해당 공고와 비슷한 조건에서 과거에는 어느 사정률로 낙찰되었는가?”를 예측하여 낙찰률 범위를 좁힙니다.
  2. 업체별 투찰 패턴 분석
    • 참여 가능성이 높은 업체(적격심사 통과, 과거 참여 빈도 높은 업체 등)의 최근 투찰률을 모아, 업체별 투찰 분포를 추정합니다.
    • 이를 통해 “어떤 구간에 경쟁이 심하게 몰릴 것인가”를 미리 예측할 수 있습니다.
  3. 공백 구간 탐색
    • 참여할 업체들의 투찰 분포를 합산한 결과(전체 경쟁 분포)에서, 밀도(경쟁)가 낮은 지점을 탐색합니다.
    • 해당 구간이 낙찰 가능 구간(회귀 모델이 예측한 낙찰률 범위)과 겹친다면, 낙찰 확률이 크게 올라갈 수 있습니다.

마무리

  • 이번 글(#1)에서는 **프로젝트 필요성과 전반적인 구성(아키텍처)**를 살펴보았습니다.
  • 나라장터 공고를 비롯해 다양한 공공 조달 데이터가 축적되고 있는 만큼, 머신러닝을 통한 낙찰 가능 지점 탐색은 앞으로도 입찰 전략에서 점차 중요해질 전망입니다.
  • **다음 글(#2)**에서는 실제 DB 스키마 설계, ETL 파이프라인 구현에 대한 보다 구체적인 내용을 다룰 예정이니 많은 관심 부탁드립니다.

Tip:

  • 사정률(낙찰률) 예측이 아무리 정확해도, 실제 공사 이윤을 고려해야 하므로 너무 낮은 투찰을 지양하는 것이 중요합니다.
  • 본 시스템은 통계적·확률적 분석을 제공할 뿐, 최종 의사결정은 실무자가 다양한 리스크 요소를 평가해 판단해야 합니다.
  • 적격심사 요건이나 발주처별 제한 범위가 변경될 수 있으므로, 지속적 업데이트가 필수입니다.

글이 유익하셨다면, 이후 시리즈 글(#2, #3, #4…)도 기대해 주세요!
질문이나 추가 의견이 있으시다면 댓글로 남겨주시면 감사하겠습니다.
다음 글에서 뵙겠습니다. 감사합니다.