- 实际中很多数据是有时序的
- 电影的评价随时间变化而变化
- 拿了奖后评分上升,直到奖项被遗忘
- 看了很多好电影后,人们的期望变高
- 季节性:贺岁片,暑期档
- 导演、演员的负面报道导致评分变低
-
音乐、文本、语言和视频都是连续的
- 标题“狗咬人”远没有“人咬狗”那么令人惊讶
-
大地震发生后,很有可能会有几次较小的余震
-
人的互动是连续的,从网上吵架可以看出
-
预测明天的股价要比填补昨天遗失的股价更困难
- 对条件概率建模
- 假设当前数据只跟τ个过去数据点相关
- 时序模型中,当前数据跟之前观察到的数据相关
- 自回归模型使用自身过去数据来预测未来
- 马尔科夫模型假设当前只跟最近少数数据相关,从而简化模型
- 潜变量模型使用潜变量来概括历史信息
当然比4好,也有局限性,tau特别大,训练样本变小,模型变复杂
没有太多联系,两个不同的观点,但是潜变量模型可以使用隐马尔科夫假设。潜变量-怎么建模,隐马尔科夫-这个数据和之前多少个数据有关。
tau取决于对数据的理解,没有固定的规则
具体问题具体分析,在有些领域做得好比如写作,写代码,在一些领域做的不好,比如预测股票。
当然可以,有计算量的增加,也不一定更好
与数据关系比较大,负类样本较少,所以比较难训练