ESP32를 활용한 RL기반 AP 최적 선택 src
연결된 네트워크 내부에서 최적 조건의 AP 탐색
이 프로젝트는 강화학습 기반 WiFi 핸드오버 최적화 시스템으로, 드론이 이동하는 환경에서 최적의 WiFi AP를 스스로 선택하도록 설계되었습니다.
드론이 이동할 때 다음과 같은 문제가 발생합니다.
-
네트워크 신호 품질이 급격히 변화함
-
수동 네트워크 전환이 불가능함
-
기존 방식(RSSI 기반 선택)은 성능이 제한적임
기존 방법의 한계:
-
단일 신호 세기 기준 판단
-
네트워크 지연 시간 미고려
본 프로젝트는 강화학습 (UCB 알고리즘) 기반으로 네트워크 선택을 수행합니다.
주요 기능
✅ WiFi AP 자동 스캔
✅ RL 기반 네트워크 선택
✅ 지연 시간 기반 보상 학습
✅ 핸드오버 비용 패널티 적용
✅ 실시간 로그 기록
🧠 학습 전략
Upper Confidence Bound (UCB) 탐색 전략을 사용합니다.
보상 함수:
보상 = (1000 / 지연시간) + 네트워크 품질 점수 - 핸드오버 비용
ESP32S
C / C++
강화학습
UCB 탐색 알고리즘
본 프로젝트는 MISRA C 코딩 표준을 일부 따르고 있습니다.