본문 바로가기

전체 글

(132)
Discrete choice modeling 초이스 모델링 (choice modeling) 공부를 하다보면 logit model, mixed logit model, probit model 등 다양한 모델들에 대한 이름을 접하게 된다. 본 게시글에서는 각 모델들이 나오게된 배경과 특징은 무엇인지, 모델에 필요한 가정은 무엇인지, 추정 방법은 어떻게 되는지 등등을 정리해보려고 한다. 시작하기 전에, 이 포스팅은 대부분 코넬대학교 Ricardo Daziano 교수님의 강의 내용을 정리했음을 밝힌다. 용어를 영어로도 밝혀야할 필요가 있다고 판단한 경우 병기했다. 0. 선수 지식¶0. 1. Cholesky decomposition¶역행렬 $A^{-1}$ 이 존재하면서 대칭 행렬 $A^{T} = A$ 인 행렬 A가 있을때 그 행렬을 하삼각행렬(lower tr..
NYC 자전거 재배치 인센티브 제도 (Bike angles) www.citibikenyc.com/bike-angels Bike Angels | Citi Bike NYC Bike Angels are Citi Bike riders that improve the availability of bikes and docks for fellow riders and earn rewards along the way. www.citibikenyc.com 공유자전거 재배치를 위한 인센티브 제도 운영 사례 (뉴욕시티 bike angles)
Palm Khintchine Theorem - 포아송 분포 시간대별 공공자전거 대여소의 대여/반납 이용 수요를 포아송 분포로 가정할 수 있는 이유 아래와 같은 reasoning 을 따라가보자. Palm Khintchine Theorem 의 핵심 아이디어를 따른다. n 명의 사람들이 각기 독립적으로 행동하는 상황을 생각해보자. 시간을 한 유닛 단위 (델타) 로 나눴다고 생각해보자 -이를 보통 영어로는 time slot이라 표현한다-. 어떤 이벤트의 발생 확률은 람다 라고 가정해보자. 각 사람이 한 time slot 안에 특정 이벤트를 발생시킬 확률은 다음과 같이 표현한다. $$p_n = \lambda \delta/n$$ 이제 한 time slot안에 어떤 이벤트의 총 발생 횟수는 이항 확률 분포를 따른다고 할 수 있다. $$Bionomial(n, p_n)$$ n이..
[python] json 파일 읽기 from os import path import json data_path = path.join('파일경로/파일이름.json') with open(data_path, newline='') as in_file: df = json.load(data_path) path 패키지랑 json 패키지 pip install 후 이렇게 읽으면 됨.
미국 박사 1년차 (fellowship 받는 경우) 텍스 하기 1. 비거주 외국인 (Non-resident alien)의 경우 Sprintax를 사용해야함. Turbo Tax는 미국 시민이거나 resident alien (6과세년도) 지위를 획득한 시점 이후에 사용할 수 있음. Sprintax 아이디 금방 만듬. 로그인하고 시작하면 양식 입력하다가 실수로 끄더라도 저장 잘 되어있음. https://www.sprintax.com/ots/choose-tax-year.html 2. 1098T 는 비거주 외국인의 경우 필요 없음 3. Form 1042-S : 이게 내가 세금 용으로 준비한 유일한 서류. 한국과 미국의 조세 협약 (tax treaty)으로 비거주 외국인 (Non-resident alien)의 경우 한해 $2000불의 세금 감면 혜택을 받음. 매년 초에 Tax..
인스턴트팟으로 맥반석계란(찜질방계란) 만들기 완성샷 준비물은 계란, 인스턴트 팟. 계란은 상온에 꺼내놓거나 시간이 없으면 살짝 뜨뜻한 물에 담궈둔다. 저 버튼마다 압력, 시간이 다른데 meat 누르면 high pressure, 2시간으로 세팅된다. 혹시 인스턴트 팟 버전마다 세팅이 달라도 high pressure, 2시간만 맞추면된다. 한시간하면 저 색이 안나오고 2시간은 해야한다! 인스턴트 팟이란게 버튼만 누르면 끝이기 때문에 버튼 눌러놓고 다른일 하거나 자면 되기 때문에 2시간 안할 이유가 없다~! 내일 이스터라 친구들 나눠주려고 만들었다. 초간단 인기짱✨ 덧) 4시간 꾸우면 더 맛있음
공공자전거 최적화 문제로 포뮬레이션하기 보통 공공자전거 문제를 최적화 문제로 풀면 목적 함수가 maximize customer satisfaction/revenue 혹은 minimize outages (자전거를 대여하고자 할때 재고 없는 상황/반납하고자 할때 반납가능한 거치대 (dock/rack) 이 없는 상황) 될 것이라고 쉽게 생각할 수 있다. 한가지 중요한것은 사람들이 대여/반납할 때 실패하는 상황은 데이터에 드러나지 않는다는 것이다. 이 현상을 censoring 이라 한다. 최적화 문제에서의 결정 변수(decision variables)를 다음과 같이 설정할 수 있다. Station locations: (every year)Station capacity: (every 6 months)Number of bikes at each stati..
[SP design] d efficiency prior parameter SP design을 하다보면 orthogonal design, d efficiency design 이라는 말이 나온다. orthogonal design은 말그대로 가능한 모든 조합을 다 고려하는건데 attributes, level 의 개수가 많아지면 불가능해진다. 이때 쓰는게 d-efficiency 이다. 초이스셋 일부분만 고려하되 orthogonality를 최대한 보존하는 방식이다. 설계 구현을 위해서는 r 에 choiceDes 패키지 쓰면 됨 cran.r-project.org/web/packages/choiceDes/choiceDes.pdf d-efficiency는 prior parameter 라는걸 선택해야한다. 구축할 모델의 parameter가 어떻게 될지는 모르지만 대충 예상한 후 그걸로 d-e..