cs213n
Data Driven Approach
- Collect the Data
- Use Machine Learning to train a classifier
- Evaluate the classifier on the new data
- 如果还有疑问对与Machine Learning 和 Deep learning,可以参照00的这篇blog
KNN
- train 的复杂度是O(1),而prediction则是O(n),意味着对一个新的事物作出判断的时候需要比学习更久的时间。所以很少用于images
- 个人理解,如果脑海中抽象了一只猫的概念,那么人才可能对于瞬间闪过的猫能判断。如果判断的速度比学习还慢,学习了有啥用?所以不合理。
Cross-Validation
- 看到这次参数还是因为看到自己用tensorflow train的一个模型才发现这个参数。看了这个ppt才大概明白具体在讲什么。
- 对一个已经tag好的数据建立模型
- 用所有的数据做train
- 用大部分数据做train,然后小部分数据(通常8:2)来做test
- 用大部分数据做train,在用小部分数据validation,在小部分数据做test。
- 用大部分数据做train,结合小部分1数据分割成一个一个folds 做validation,取这些folds的均值来代表整个model的validation,成为cross-validation,然后小部分数据做test。