{"skill":{"slug":"housesigma-collector","displayName":"Housesigma Collector","summary":"HouseSigma 매물 데이터를 자동 및 수동으로 수집해 Hauscout SQLite DB에 저장하고 크론잡으로 주기적 업데이트를 지원합니다.","description":"# HouseSigma Collector Skill\n\nHouseSigma에서 매물 데이터를 수집하여 Hauscout SQLite DB에 저장하는 skill.\n\n## 프로젝트 경로\n- **Hauscout**: `/Users/kendrick/projects/hauscout`\n- **DB**: `/Users/kendrick/projects/hauscout/data/hauscout.db`\n- **스크립트**: `/Users/kendrick/projects/hauscout/scripts/collect.ts`\n\n## 사용법\n\n### 자동 수집 (검색 프로필 기반)\n```bash\ncd /Users/kendrick/projects/hauscout && npx tsx scripts/collect.ts\n```\n\n### 특정 매물 수집\n```bash\ncd /Users/kendrick/projects/hauscout && npx tsx scripts/collect.ts --url \"<housesigma_url>\"\n```\n\n### 특정 프로필만 수집\n```bash\ncd /Users/kendrick/projects/hauscout && npx tsx scripts/collect.ts --profile <id>\n```\n\n### 브라우저 창 보면서 수집 (디버깅)\n```bash\ncd /Users/kendrick/projects/hauscout && npx tsx scripts/collect.ts --headed\n```\n\n## 수동 수집 (브라우저 직접 사용)\n\nPlaywright 스크립트 대신 Clawdbot 브라우저로 직접 수집할 때:\n\n1. 브라우저로 HouseSigma 매물 상세 페이지 열기\n2. DOM 스냅샷에서 데이터 추출\n3. SQLite에 직접 INSERT\n\n### DOM 데이터 매핑\nHouseSigma 상세 페이지의 구조:\n- **주소/상태**: `<h1>` 태그 (Unit X - Street - Municipality - Community)\n- **가격**: `<em>` 태그의 `$ X,XXX` 패턴\n- **Key Facts**: `<dt>`/`<dd>` 쌍 (Tax, Property Type, Maintenance, etc.)\n- **Details**: 같은 `<dt>`/`<dd>` 패턴 (Bedrooms, Bathrooms, etc.)\n- **방 정보**: \"Metres\" 섹션의 텍스트 패턴\n- **Estimates**: SigmaEstimate, Estimated Rent, Rental Yield\n- **학교**: Catchment Schools 섹션\n- **인기도**: \"Popularity : XX/100\" 텍스트\n- **커뮤니티 통계**: Community Statistics 섹션\n\n## 검색 프로필 관리\n\n프로필 추가:\n```bash\ncd /Users/kendrick/projects/hauscout\nsqlite3 data/hauscout.db \"INSERT INTO search_profiles (name, center_lat, center_lng, radius_km, property_types, price_min, price_max, beds_min, beds_max, baths_min, baths_max, is_active) VALUES ('이름', lat, lng, radius, '[\\\"Condo Apartment\\\"]', 0, 800000, 2, 3, 1, 2, 1);\"\n```\n\n현재 프로필 확인:\n```bash\nsqlite3 data/hauscout.db \"SELECT * FROM search_profiles;\"\n```\n\n## 데이터 수집 후\n\n수집 후 대시보드에 반영하려면:\n```bash\ncd /Users/kendrick/projects/hauscout\ngit add data/hauscout.db\ngit commit -m \"data: daily collection $(date +%Y-%m-%d)\"\ngit push\n```\nVercel 배포 시 자동으로 최신 데이터가 반영됩니다.\n\n## 크론잡\n\nClawdbot cron으로 매일 오전 9시에 자동 수집:\n- 스크립트 실행 → DB 업데이트 → git commit & push\n\n## 주의사항\n- HouseSigma rate limiting 방지를 위해 요청 간 2-4초 간격 유지\n- headless 모드에서 차단될 수 있음 → --headed 옵션으로 확인\n- 검색 프로필의 결과가 많으면 시간이 오래 걸림 (매물당 ~5초)\n","tags":{"latest":"1.0.0"},"stats":{"comments":0,"downloads":708,"installsAllTime":1,"installsCurrent":1,"stars":0,"versions":1},"createdAt":1772626154095,"updatedAt":1778995204507},"latestVersion":{"version":"1.0.0","createdAt":1772626154095,"changelog":"Initial release of the HouseSigma Collector Skill.\n\n- Collects HouseSigma listing data and saves to Hauscout SQLite DB.\n- Supports automated, profile-based, and targeted collection via command-line options.\n- Provides manual collection workflow using browser and DOM data mapping for custom data extraction.\n- Includes instructions for managing search profiles and integrating collected data with the dashboard.\n- Supports daily automated collection via cron, with built-in precautions for rate limiting and headless browsing.\n- Detailed usage and maintenance guides are provided in the documentation.","license":null},"metadata":null,"owner":{"handle":"sonim1","userId":"s176d4hx6h8wkhxsr8qedrrdcs8845w9","displayName":"sonim1","image":"https://avatars.githubusercontent.com/u/2497849?v=4"},"moderation":{"isSuspicious":false,"isMalwareBlocked":false,"verdict":"clean","reasonCodes":["review.llm_review"],"summary":"Review: review.llm_review","engineVersion":"v2.4.24","updatedAt":1780089755212}}