※ 모든 지표는 PoC 목표 예시값이며 실제 검증을 통해 확정됩니다.
전시장 평면 위에서 작업자(점)·중장비(사각)·위험구역(붉은 영역)을 시뮬레이션합니다. 안전모 미착용(붉은 점)·위험구역 침입·중장비 근접이 감지되면 우측 알림 피드와 OZ eForm 안전조치 보고로 이어집니다. 감지 규칙은 SWRL R6~R7로 지식그래프와 동일 체계입니다.
내부 문서를 RAG로 검색하고(근거 문단·페이지 표시), 회의 녹취를 회의록으로, 회의록을 OZ Report 보고서 서식으로 자동 변환합니다. 검색어를 선택해 보세요.
검색어 칩을 누르면 근거 문단과 함께 결과가 표시됩니다.
행사정보(RAG) · 참가업체 · 부스위치 · 주차 · 편의시설 · 분실물 문의를 챗봇/키오스크/웹/앱에서 응대합니다. 질문 칩을 눌러 체험해 보세요. 모든 답변에 지식그래프 근거가 붙습니다. 민원 4종(문의·불편·분실물·주차)은 OZ eForm으로 접수됩니다.
| 입력(한국어 기준) | 출력 예 |
|---|---|
| 전시장 B홀은 어디인가요? | Where is Exhibition Hall B? |
| 전시장 B홀은 어디인가요? | B馆在哪里? |
| 주차요금은 얼마인가요? | 駐車料金はいくらですか? |
| 분실물은 어디서 찾나요? | Tìm đồ thất lạc ở đâu? |
전시(전시회·홀·부스·업체·주차) + 안전(작업자·위험구역·중장비·CCTV) + 행정(문서·회의록·보고서) 도메인을 하나의 그래프로 통합합니다. 노드를 드래그/클릭해 보세요 — 클릭 시 RDF 트리플이 표시됩니다.
질문을 선택하고 [추론 실행]을 누르면 ① 의도분류 → ② 엔티티 링킹 → ③ SPARQL 생성 → ④ SWRL 규칙 점화 → ⑤ 답변 생성이 순차 점등되고, 위 지식그래프에 추론 경로가 노란색으로 켜집니다.
동일 시드(seed)로 반복 실행하면 항상 동일한 결과가 재현됩니다(결정적 PRNG). 시드를 바꾸면 표본이 달라지며, 트라이얼 간 분산으로 응답 일관성·추론경로 재현율을 검증합니다 — RAGAS·RGB 벤치마크의 재현성 원칙을 따릅니다.
막대: 트라이얼별 정답률 · 노란 선: 추론경로 재현율 · 동일 SEED 재실행 시 결과 해시가 일치하면 재현성이 입증됩니다.
3대 AI 영역의 테스트 질의 14건을 정확성(Correctness) · 근거충실성(Faithfulness) · 답변관련성(Relevancy) · 완전성(Completeness)으로 채점합니다. 근거충실성은 답변의 모든 주장에 그래프/문서 근거가 있는지를 측정해 환각을 탐지합니다.
| # | 테스트 질의 | 카테고리 | 정확성 | 근거충실성 | 관련성 | 완전성 | 종합 |
|---|
대민서비스 AI의 검증 체계를 정리한 장입니다. 온톨로지 설계 명세, 질의 1건의 타임스탬프 단위 추론 추적, 적대적 공방(Red Team) 10라운드, 퓨샷 러닝 적용·검증으로 구성됩니다. 지식그래프 · 재현성 · QA 점수화는 상단 공통 장과 연동됩니다.
| 클래스 (9종) | 주요 데이터 속성 | 인스턴스 예 |
|---|---|---|
| Exhibition | 일정 · 주제 · 등록방법 | AI EXPO 2026 외 2 |
| Venue / Hall | 주소 · 운영시간 / 면적 · 부스 수 | 제1·2전시장 / A·B·C홀 |
| Booth / Exhibitor | 번호 · 면적 / 산업분류 · 전시품 | A-125 / LG CNS |
| ParkingLot | 요금정책 · 면수 · 실시간 잔여 | P1(1,200면) · P2 · P3 |
| Amenity | 위치 · 운영시간 | 식당가 · 카페 · 유실물센터 |
| Complaint | 유형 · 서식ID · 처리상태 | 문의Q01 · 불편C01 · 분실L01 · 주차P01 |
| Channel | 지원언어 | 챗봇 · 키오스크 · 앱 · 웹 |
| 객체 속성 | 정의역 → 치역 |
|---|---|
| hostedIn / partOfVenue | Exhibition→Hall / Hall→Venue |
| locatedInHall / occupiesBooth | Booth→Hall / Exhibitor→Booth |
| nearestParking / hasAmenity | Venue→ParkingLot / Venue→Amenity |
| submittedVia / routeTo | Complaint→Channel / Complaint→부서 |
일관성 검증: HermiT/Pellet 추론기로 클래스 충돌·순환 정의 검사, SHACL로 필수 속성 누락 검사(예: Booth는 locatedInHall 1개 필수). 추론 규칙은 상단 SWRL R1~R5와 동일 체계.
질의 1건의 전체 처리 경로를 단계별로 추적합니다. 실행 시 로그가 순차 점등되고, 상단 지식그래프에 추론 경로가 강조됩니다.
레드팀이 적대적 질의를 시도하고 4단 방어 계층(① 입력 필터 → ② 그래프 근거 검증 → ③ 정책 가드레일 → ④ 출력 검사)이 차단합니다. 합격 기준: 방어율 ≥95%. 본 표는 설계 검증용 데모이며, 실제 PoC에서는 공격셋 100건+ · OWASP LLM Top 10 항목별 커버리지로 확대합니다.
| R | 공격 유형 | 공격 시나리오(요지) | 방어 계층 | 판정 |
|---|
| 구분 | 예시 수 | 정의 | 대민서비스 적용 |
|---|---|---|---|
| 제로샷 (Zero-Shot) | 0개 | 예시 없이 클래스 속성·자연어 설명(프롬프트)만으로 추론 | 신규 민원 유형을 정의문만으로 분류 |
| 원샷 (One-Shot) | 1개 | 예시 1개만 제공하여 추론 | 새 행사 안내문 1건으로 유사 질의 응대 |
| 퓨샷 (Few-Shot) | 수~수십 개 | 극소량 예시로 맥락 적응(In-Context Learning) | 의도분류·엔티티링킹 예시 5~20개 주입 |
정리: 데이터 0개=제로샷, 1개=원샷, 수 개=퓨샷. "데이터를 몇 개 주고 테스트"는 학술적으로 퓨샷 프롬프팅(Few-Shot Prompting)으로 표기 (Brown et al., 2020). 적용 지점: 의도분류 12종 · 엔티티 표기변형 정규화("엘지씨엔에스"→expo:eLG) · 민원 4종 분류 · 다국어 질의.
| 설정 | 예시 수 k | 의도분류 정확도 | 엔티티링킹 정확도 | 민원분류 정확도 | 판정 (기준: 퓨샷 k=5 ≥90%) |
|---|
인터뷰 퀵 10문항의 1번("연간 행사 건수는?")이 모든 판단의 출발점인 이유입니다. 아래에 건수를 입력하면 ③작업량 · ④문서량 · ⑥예산 구간 · ⑦KPI 절감 수치가 즉시 계산됩니다.
AI는 문서를 학습해야 답변할 수 있습니다. 파이프라인: 문서 → 벡터DB → RAG → AI 답변
| 문서 100건 | 문서 10,000건 | |
|---|---|---|
| 학습 데이터 | 부족 | 행사 · 계약 · 회의 · 보고서 등 풍부 |
| 답변 범위 | 제한 | AI 업무비서 구축 가능 |
| 판정 | PoC만 가능 | 사업성 매우 높음 |
결론: "AI가 먹을 데이터가 충분한가?"
AI를 도입할 때 반복 업무가 얼마나 발생하는가를 판단하기 위한 질문입니다.
| 연간 행사 30건 | 연간 행사 300건 | |
|---|---|---|
| 안전점검 | 30회 | 수천 회 |
| 결과보고서 | 30건 | 수백 건 |
| 민원 · 방문객 | 민원 中 · 대시보드 적용 적음 | 방문객 수백만 명 |
| 판정 | AI 투자 효과 체감적 | AI 투자 효과 매우 큼 |
연간 500건 행사 → 행사 결과보고서 500건 → AI 업무비서 학습 가능 → 행사 추천 AI → 매출 예측까지 연결됩니다.
→ PoC 대상은 "행사 건수 × 데이터 축적량"이 큰 업무부터 선정 (G1 데이터 게이트와 직결)
결론: "PoC를 검증할 데이터가 충분한가?"
행사 수가 많을수록 설치·철거, TBM, 출입허가, 안전점검 등 반복 업무가 폭증하여 AI 효과가 커집니다.
⚠ 행사 수가 적으면 안전 AI ROI가 낮아질 수 있습니다 → PoC 우선순위에서 후순위 조정
행사 1건당 발생 문서 약 20~50건 — 계약서 · 견적서 · 회의록 · 결과보고서 · 정산서 · 승인서.
AI 업무비서 효과 큼 → RAG 사업성 확보. 연간 행사 건수는 업무비서 ROI 계산의 핵심 변수입니다.
행사 수 ↑ → 방문객 수 ↑ → 문의량 ↑ → 챗봇 효과 ↑ 의 연쇄 구조입니다.
→ 자동응대율 70% KPI의 분모가 방문객·문의량 — 인터뷰 ⑧(연간 방문객 · 콜센터 상담 건수)과 연동
| 연간 행사 건수 | 구축 범위 | 예산 규모(예시) | 현재 입력값 판정 |
|---|
연간 행사 건수는 본사업 예산 규모를 결정하는 가장 중요한 기준입니다. (FP 예산안 · 3개년 로드맵과 연동)
※ 인터뷰에서 "행사당 보고서 작성 시간"의 실측값을 받으면(G2 베이스라인) 이 계산이 고객 데이터 기반 정당화 자료가 됩니다.
안전 AI는 결국 CCTV 영상을 분석합니다. 즉, CCTV가 없으면 → AI 없습니다. 안전관리 규모와 ROI 계산의 출발점입니다.
| CCTV 수량 | 예상 규모 |
|---|
확인 포인트
□ 제조사/모델 □ RTSP 지원 여부 □ 화질(FHD/4K) □ 저장 기간 □ 영상 반출 가능 여부 □ 네트워크 환경
핵심 질문: AI가 볼 눈(CCTV)이 몇 개인가?
대민서비스 챗봇의 학습 데이터 확인입니다. 챗봇이 학습할 것: "오늘 행사 뭐 있나요?" · "Hall 5는 어디인가요?" · "주차비는 얼마인가요?" · "휠체어 대여 가능한가요?"
| FAQ 없는 경우 | 답변 근거 부족 → 환각(Hallucination) 증가 → 정확도 하락 → PoC 위험 |
| FAQ 많은 경우 | 1,000건 이상 → AI 학습 가능 → 자동응대율 상승 → PoC 성공 가능성 상승 |
실제 체크 포인트
☑ FAQ 수량 (100 / 500 / 1,000+?) ☑ 최신성(최근 업데이트 날짜) ☑ 저장 위치(홈페이지/엑셀/PDF/그룹웨어) ☑ 담당 부서 ☑ 내용 품질(일관성/정확성)
핵심 질문: AI가 답변할 지식 데이터가 충분한가?
PoC 성공 여부를 증명하는 필수 기준값입니다. AI 사업은 "좋아진 것 같습니다"가 아니라 "몇 % 좋아졌는가"를 증명해야 합니다.
KPI 기준 데이터가 없으면?
✖ 현재 문의량 모름 ✖ 보고서 작성시간 모름 ✖ 행사 작성 건수 모름 → 개선율 계산 불가 · PoC 성공 증명 불가 · 내년 예산 확보 어려움
핵심 질문: 성과를 측정할 기준값이 있는가?
| 서비스 | 현재 데이터 (예시) | 목표 KPI (예시) |
|---|---|---|
| 🛡️ 안전 AI | 안전사고 건수 · 아차사고 건수 · 안전점검 시간 · 보고서 작성 시간 | 사고 20% 감소 · 점검시간 50% 감소 · 보고서 80% 자동화 |
| 📄 업무효율 AI | 문서 검색 시간 · 회의록 작성 시간 · 보고서 작성 시간 | 검색시간 70% 감소 · 회의록 80% 감소 · 보고서 60% 감소 |
| 💬 대민서비스 AI | 문의량 / 전화상담량 · FAQ 응답시간 · 고객만족도 | 자동응대율 70% · 응답시간 80% 감소 · 만족도 20% 향상 |
"CCTV 대수, FAQ 데이터, KPI 기준 데이터를 여쭤보는 이유는 AI 기술 때문이 아니라, 올해 PoC가 성공할 수 있는지와 내년 본사업 예산을 객관적으로 산정하기 위해서입니다."
AI는 결국 데이터가 있어야 학습하고, KPI 기준이 있어야 성과를 증명할 수 있습니다.
☑ CCTV: 제조사 · 화질 · 저장기간 · 네트워크 환경
☑ FAQ: 수량 · 최신성 · 저장위치 · 품질
☑ 문서: HWP/HWPX/PDF/Excel 수 · 연도 · 보안
☑ KPI: 현재 업무시간 · 현재 수치 · 측정 방법
☑ 보안/개인정보: 반출 가능 여부 · 비식별화 가능 여부
정리 — "CCTV 대수 · FAQ 데이터 · KPI 기준 데이터"는 AI 사업의 성공 여부 · 투자 효과 · 예산 규모를 결정하는 가장 중요한 기초 데이터입니다. 데이터가 명확할수록 AI 사업의 성공 가능성과 ROI는 기하급수적으로 높아집니다!
PoC 성공기준은 ① AI 측정 지표냐 ② 현업 만족이냐 ③ 경영 보고냐에 따라 완전히 다릅니다. AI 인식률이 수치상 좋아도 사고·민원 불만이 많으면 효과가 없습니다(꽝). 판정 순서는 경영 보고 → 현업 만족 → AI 지표 — AI 지표는 마지막입니다. PoC가 실패하면 내년 예산도 영향을 받습니다.
경영진이 예산을 승인하는 언어 — 사고 · 민원 · 비용 · 시간의 절대량 변화. 이 층이 나쁘면 AI 지표가 아무리 좋아도 실패입니다.
예: 안전사고 20% 감소 · 전화 문의 월 1,000→700건(30%↓) · 보고서 연 400시간 절감
실제 쓰는 사람의 판정 — 만족도 · 재사용 의향 · 업무 부담 체감. 현업이 외면하면 본사업에서 사용률이 무너집니다.
예: 실무자 만족도 ≥85% · 재사용 의향 ≥80% · 오탐 피로도 허용 수준
기술 검수의 기초 체력 — 정확도 · mAP · 응답속도. 필요조건이지 충분조건이 아닙니다. 이 층만으로 성공을 주장하면 분쟁이 생깁니다.
예: 정답률 ≥90% · 감지 mAP ≥85% · 응답 ≤3초
AI 인식률 95%(① 충족) + 사고 · 민원 불만 증가(③ 미충족) = 효과 없음, 꽝. 성공 판정은 ③ 경영 → ② 현업 → ① AI 순서의 게이트이며, 상위 게이트를 통과하지 못하면 하위 지표는 의미가 없습니다.
| ✖ | 성과를 객관적으로 판단할 수 없습니다. |
| ✖ | 개발사 · 고객 간 해석 차이로 분쟁이 발생합니다. |
| ✖ | 효과를 수치로 증명하지 못해 예산 확보가 어렵습니다. |
| ✖ | PoC가 단순 시연으로 끝나고 본사업으로 이어지지 않습니다. |
명확한 성공기준 = 성공적인 PoC = 본사업 확장!
| ① | KPI 설정 | 무엇을 측정할 것인가? |
| ② | ROI 계산 | 얼마나 절감하는가? |
| ③ | 예산 확보 | 내년 10억~15억 사업 가능 여부 |
| ④ | 본사업 확장 | PoC → 본사업 전환 근거 |
💡 명확한 성공기준이 AI 사업의 성공과 예산 확보, 본사업 확장의 출발점입니다. (G2 베이스라인 게이트 — 성공/실패 판정 기준 사전 합의와 직결)
서비스를 선택하면 3계층 권고 기준이 표시됩니다. 인터뷰에서 수치를 고객과 합의한 뒤 [합의서 복사]로 회의록에 붙여넣으세요.
| 게이트 | 성공 기준 (권고) | 측정 방법 · 베이스라인 |
|---|
서비스 요건 6종 + 3대 AI를 기능 분해하여 데이터 기능(ILF/EIF)과 트랜잭션 기능(EI/EO/EQ)으로 식별하고, SW사업 대가산정 가이드의 간이법(평균복잡도 가중치)으로 기능점수를 산정했습니다. 기준단가 605,784원/FP(2024 개정판 현행화, 2025 개정판은 AI 커스터마이징 유형 기준 추가). 단가·보정계수·이윤율을 수정하면 전체 예산이 즉시 재계산됩니다.
※ 보정계수 기본값은 예시이며, 확정 시 SW사업 대가산정 가이드(2025 개정판)의 규모·SW유형·품질특성 산식과 AI 커스터마이징(기본형·데이터형·모델형) 기준을 적용해 정밀 산출합니다. 간이법 평균 가중치: ILF 7.5 · EIF 5.4 · EI 4.0 · EO 5.2 · EQ 3.9
| 모듈 | 세부 기능 | 유형 | 개수 | 가중치 | FP |
|---|
HW는 조달 견적, 상용SW는 라이선스 정책가 기준으로 별도 산출 후 합산. 운영·유지관리비(2년차~)는 가이드에 따라 투입공수 방식으로 별도 산정.
본사업(10억) 발주 전, 핵심 기능의 기술 검증을 위한 PoC(8주, 별도 소규모 예산) 계획입니다. 기능별 가능여부를 먼저 판정하고, 가능 항목에 대해 시나리오 → 데모 → 내년도(2027) 본사업 기능별 예산 수립으로 이어집니다.
판정 기준: 데이터 확보 가능성 · 기술 성숙도(상용/오픈소스) · 8주 내 정량 검증 가능성. 전 항목 PoC 가능(즉시 8건 · 조건부 2건) — 불가 항목 없음.
| 기능 | 판정 | 필요 데이터/환경 | 검증 지표(목표) |
|---|---|---|---|
| 행사정보 RAG 검색 | 가능 | 행사 페이지 · 안내문 50건 | 정답률 ≥90% · 근거표시 100% |
| 참가업체 · 부스위치 안내 | 가능 | 업체/부스 목록(엑셀) 1개 전시 | 3-hop 추론 정확도 ≥95% |
| 주차 안내 | 가능 | 요금규정 · 주차장 배치도 | 응답 정확도 ≥95% |
| 다국어 응대 (EN·中·日·VI) | 가능 | 다국어 FAQ 30문항 | 번역 적절성(평가단) ≥85% |
| 키오스크 길찾기 연계 | 가능 | 평면도 1식 · 테스트 단말 1대 | 경로 표시 성공률 ≥95% |
| OZ eForm 민원 4종 접수 | 가능 | OZ 평가판 라이선스 · 서식 4종 | 접수→자동배정 누락 0건 |
| 안전관리 — 안전모/위험구역 감지 | 조건부 | CCTV 1~2채널 영상(또는 녹화본) · 개인정보 비식별 처리 동의 | 감지 정확도(mAP) ≥85% · 알림 ≤3초 |
| 안전관리 — 중장비 근접 경보 | 조건부 | 하역장 시범구역 협조 | 근접 이벤트 검출율 ≥90% |
| 행정 — 문서검색·회의록·OZ Report | 가능 | 내부문서 100건 · 회의 녹취 2건 | 검색 만족도 ≥85% · 회의록 10분 내 |
| 운영 대시보드 (요약판) | 가능 | PoC 기간 로그 | 문의 TOP10 · 통계 자동 집계 |
※ 조건부 2건은 CCTV 영상의 개인정보 비식별 조치(개인정보 보호법) 및 시범구역 협조가 선행되면 즉시 가능. 미확보 시 공개 데이터셋(안전모 탐지)으로 대체 검증.
실제 전시 1건의 데이터(행사·업체·부스·주차)로 지식그래프를 구축하고, 한국어+영어 질의 100문항으로 검증.
| 1-2주 | 데이터 수집 · 온톨로지 구축 |
| 3-4주 | RAG+추론 챗봇 구성 |
| 5-6주 | 키오스크 길찾기 · 다국어 연계 |
| 7-8주 | 100문항 평가 · 보고 |
성공기준: 정답률 ≥90% · 근거표시 100% · 응답 ≤3초 · 외국어 적절성 ≥85%
설치·철거 기간 CCTV 1~2채널(비식별 처리)로 YOLO 계열 감지모델을 검증하고 알림→OZ eForm 자동기록까지 연동.
| 1-2주 | 영상 확보 · 비식별 · 라벨링 |
| 3-5주 | 감지모델 적용 · 튜닝 |
| 6-7주 | 알림 · FORM-S01 연동 |
| 8주 | 정량 평가 · 보고 |
성공기준: 감지 mAP ≥85% · 오탐률 ≤10% · 알림 ≤3초 · 기록 누락 0건
내부 문서 100건 색인 후 근거 문단 표시 검색을 검증하고, 실제 회의 2건을 회의록→보고서로 자동 변환.
| 1-2주 | 문서 수집 · 색인/임베딩 |
| 3-4주 | 근거표시 검색 구성 |
| 5-6주 | 회의록 · OZ Report 변환 |
| 7-8주 | 실무자 평가 · 보고 |
성공기준: 검색 만족도 ≥85% · 회의록 초안 10분 내 · 보고서 근거표기 100%
2026 하반기 PoC(0.8억) → 2027 본사업 1차(7.0억, 핵심 기능 구축) → 2028 고도화 2차(2.2억). 본사업 SW개발비는 FP 예산안(⑤97억=5.97억)의 모듈별 FP 비중으로 배분하고, PoC 결과에 따라 우선순위를 조정합니다.
| 단계 | 기간 | 범위 |
|---|---|---|
| PoC | 2026.H2 (8주) | S1·S2·S3 검증 — 0.8억 |
| 1차 본사업 | 2027 | 대민 챗봇·다국어·키오스크·민원·안전(1단계)·대시보드 + HW — 7.0억 |
| 2차 고도화 | 2028 | 안전 전면확대 · 행정 자동화 고도화 · 웹앱 고도화 — 2.2억 |
내년 AI 사업 예산 수립을 위해, 올해 PoC로 검증할 구체 업무(서비스별 1~2개)를 도출하는 현장용 체크리스트입니다. 각 질문에 답을 들으며 체크하고, 반복·수기·시간소모·리스크가 큰 업무는 ★ 표시하면 하단에 PoC 후보로 자동 정리됩니다.
| 목적 | 내년 AI 사업 예산 수립을 위해, 올해 PoC로 검증할 구체 업무(서비스별 1~2개)를 도출 |
|---|---|
| 대상 서비스 | ① 안전관리 AI ② 행정업무 효율화 AI ③ 대민서비스 AI (오늘 핵심) |
| 사용법 | 각 단계 질문에 답을 들으며 체크 → 반복·수기·시간소모·리스크가 큰 업무를 PoC 후보로 ★ 표시 |
| 작성 | AI 사업 컨설팅 / 미팅 현장용 · 소요 약 40분 (오프닝 5분 + 본문 30분 + 마무리 5분) |
전체 인터뷰가 어려우면 이 10개만 받아도 PoC 가능여부 1차 판정이 됩니다. ①~⑥ 데이터/현황 → ⑦ 베이스라인 → ⑧~⑩ 예산 · 판정 · 본사업 경로.
단순 나열이 아니라 판정 구조입니다. G1~G5 게이트 중 하나라도 미충족이면 PoC가 불가하거나 효과 입증이 불가능합니다. 각 블록은 "왜 묻는지(판정 포인트)"와 "무엇이 확인되면 통과인지(통과 기준)"를 함께 제시하며, 체크할 때마다 우측 게이트 현황이 갱신됩니다. ⑥~⑧은 게이트 통과 후 서비스별 심화 확인입니다.
판정 논리: G1 데이터 없음 → PoC 불가 · G2 베이스라인 없음 → 효과 입증 불가 · G3 본사업 경로 없음 → PoC 무의미 · G4 연계/인프라 막힘 → 구축 불가 · G5 거버넌스 미합의 → 운영 전환 불가
나열이 아닌 판정 구조입니다. ① 구축 전에 확정해야 하는 아키텍처 결정 8건(선택지 · 판단 기준 · 권고안), ② PoC/검수에서 통과해야 하는 기술 검증 체크리스트(체크 시 준비도 갱신), ③ 사전에 합의할 기술 리스크 레지스터와 인프라 사이징으로 구성됩니다. G4(연계 · 인프라) 게이트의 기술 상세판입니다.
| 결정 항목 | 선택지 | 판단 기준 (인터뷰 G4 연동) | 권고안 |
|---|---|---|---|
| LLM 배치 | 외부 API / 클라우드 프라이빗 / 온프레미스 sLLM | 망분리 여부 · 생성형 AI 사용 정책 · 개인정보(민원) 처리 위치 | 권고 망분리 시 온프레미스 sLLM + 비민감 질의만 외부 API 하이브리드 |
| 트리플스토어 | GraphDB / Apache Jena Fuseki / Neo4j(+neosemantics) | SPARQL 1.1 완전 지원 · 추론 내장 여부 · 라이선스 비용 | 권고 PoC는 Jena Fuseki(무상), 본사업은 GraphDB/상용 검토 |
| 추론기 | HermiT · Pellet(OWL DL) / SHACL Rules / 자체 규칙엔진 | R1~R8 표현력 · 응답시간(실시간 3초) · 일관성 검사 필요성 | 권고 설계검증은 HermiT, 런타임은 사전 구체화(materialization)+SPARQL |
| 벡터 검색 | pgvector / Milvus / Elasticsearch kNN | 문서량(수천~수만) · 운영 인력의 친숙도 · HA 구성 | 권고 규모상 pgvector(PostgreSQL 통합)로 충분, 수십만 건 이상 시 Milvus |
| 임베딩 모델 | 한국어 특화 / 다국어(multilingual) / 상용 API | 한국어 검색 품질 · EN·中·日·VI 교차검색 · 망분리 | 권고 다국어 임베딩 1종으로 통일(교차언어 검색) + 한국어 리랭커 |
| 문서 파싱 | HWP/HWPX 변환기 · PDF 추출 · OCR | HWPX 비중(인터뷰 ⑦) · 표/서식 보존 필요성 | 권고 HWPX→XML 직접 파싱 + 표 구조 보존, 스캔본은 OCR 별도 공수 산정 |
| CCTV 추론 위치 | 엣지 GPU(채널별) / 중앙 GPU 서버(RTSP 수집) | 채널 수(PoC 2ch→본사업 8ch) · 네트워크 대역 · 지연 3초 | 권고 PoC는 중앙 서버 RTSP 수집, 본사업 8ch 확장 시 엣지 병행 검토 |
| OZ 연계 방식 | OZ eForm/Report 서버 API / 파일 연계 / URL 호출 | 기존 OZ 서버 버전 · 결재 시스템 연동 범위 | 권고 OZ 서버 API 직접 연계(서식ID 매핑), 포시에스 기술지원 협의 선행 |
| 리스크 | 영향 | 완화책 |
|---|---|---|
| HWP/HWPX 파싱 품질(표·수식 깨짐) | 높음 | 파싱 샘플 50건 사전 검증 · 깨짐률 기준 합의(≤5%) · 수동 보정 공수 별도 |
| 한국어 고유명사 엔티티 링킹 오류(업체명 변형) | 중간 | 별칭사전 + 퓨샷 k=10~20 · 신규 업체 등록 시 자동 별칭 생성 |
| CCTV 야간·역광 감지율 저하 | 높음 | 야간 프레임 별도 라벨링 · 적외선 채널 검토 · 야간 mAP 별도 기준(≥80%) |
| 망분리 환경에서 모델 업데이트 경로 부재 | 중간 | 반입 절차 정례화(분기) · 오프라인 모델 패키징 · 보안성 검토 사전 협의 |
| 다국어(베트남어) 번역 품질 편차 | 중간 | 언어별 FAQ 30문항 사전 검수 · 미지원 표현은 영어 폴백 |
| 동시 접속 피크(전시 개막일) 응답 지연 | 중간 | 부하시험 동시 100세션 p95≤3초 검수 기준 · 캐시(빈출 질의) · 오토스케일 |
| 온톨로지-원천 데이터 동기화 지연(부스 변경) | 낮음 | 일배치 + 행사 직전 수동 트리거 · 변경분 검증 리포트 |
| 구성 | PoC | 본사업 1차 |
|---|---|---|
| GPU 서버 (LLM·임베딩) | 클라우드 GPU 1식 또는 보유 서버 활용 | GPU 서버 1식 (48GB+ vRAM ×2) |
| GPU 서버 (영상 감지) | 공용 1식 (2ch) | 전용 1식 (8ch 실시간) |
| 트리플스토어 · 벡터DB · WAS | VM 2식 | VM 4식 (HA 구성) |
| 키오스크 | 기존 1대 연계 | 4~6대 (신규/개조) |
| 네트워크 · 보안 | 기존망 + 방화벽 정책 | DMZ 구성 · RTSP 전용 VLAN |
성능 검수 기준(제안요청서 반영): 동시 100세션 · 챗봇 p95 ≤3초 · CCTV 감지→알림 ≤3초 · 가용성 99.5% · 일배치 동기화 ≤30분.
안전 · 업무효율 · 대민서비스 3대 영역과 공통 기반(지식그래프·인프라)으로 배분한 개략안입니다. 상세 산정은 2026년 SW기술자 평균임금(KOSA) 및 HW 견적 기준으로 별도 산출합니다.
온톨로지 추론 · RAG · CCTV 객체탐지 · 평가 방법론의 근거가 되는 국제 표준, 논문, 국내 법령·가이드라인입니다. 링크는 원문으로 연결됩니다.