陆孤影没有使用简单的Min-Max归一化(缩放到0-1之间),因为某些指标(如涨跌停家数)的分布可能高度偏斜,且极值会随着时间推移而变化。他选择了基于滚动时间窗口的标准化。对于每个因子,计算其过去N个交易日(例如,N=60,代表一个季度)的滚动均值和滚动标准差,然后将当前值转换为“偏离其近期均值的标准差倍数”,即Z-Score。
例如:
当前上涨家数比例 = (当前值 - 过去60日该比例均值) / 过去60日该比例的标准差
这意味着,因子值表达的是“相对于近期正常水平,当前是异常的高还是低”。一个Z-Score为+2的因子,意味着其当前值比近期的平均水平高出2个标准差,处于统计学意义上的显著高位。这对于衡量情绪的“热度”或“冷度”非常直观。
他将所有连续型因子(如上涨家数比例、波动率、新闻情感得分、论坛关键词频率等)都进行了这样的处理。对于分类或计数型因子(如涨停家数、跌停家数),则采用类似的思路,计算其相对于近期滚动窗口内均值(或中位数)的偏离倍数。
处理后的因子,变成了一个个无量纲的、可比的、反映“偏离正常程度”的数值。
------
第二步:因子分类与情绪维度映射
接下来,他将预处理后的几十个因子,按照其反映的情绪倾向,分为两大类:
• 正向情绪因子: 当该因子值“异常高”时,通常对应市场情绪偏向贪婪、乐观、亢奋。例如:上涨家数比例(Z-Score高)、涨停家数(偏离倍数高)、融资买入占比(Z-Score高)、新闻积极情感比例(Z-Score高)、论坛“牛市”、“涨停”等贪婪关键词频率(Z-Score高)。
• 负向情绪因子: 当该因子值“异常高”时,通常对应市场情绪偏向恐惧、悲观、绝望。例如:下跌家数比例(Z-Score高)、跌停家数(偏离倍数高)、波动率(Z-Score高)、股指期货贴水幅度(Z-Score高,贴水为负值,但幅度大视为Z-Score高)、新闻消极情感比例(Z-Score高)、论坛“割肉”、“熊市”等恐慌关键词频率(Z-Score高)。
同时,他意识到,情绪并非简单的“贪婪-恐惧”一维光谱,而是一个多维结构。例如,市场可能在“贪婪”的同时伴随着“高波动”(不安的贪婪),或者在“恐惧”中蕴含着“抄底”的暗流(试探性的恐惧)。因此,他初步构想将情绪分解为几个核心“维度”:
1. 乐观/悲观维度: 主要由价量广度、涨跌停、新闻情感、论坛主题倾向等因子决定。反映市场对未来的普遍看法。
2. 亢奋/恐慌维度: 主要由波动率、极端价格行为、融资盘变化、期权隐含波动率(如有)、论坛恐慌/贪婪关键词的激烈程度等因子决定。反映市场情绪的激烈程度和一致性。
3. 风险偏好维度:&n
温馨提示:亲爱的读者,为了避免丢失和转马,请勿依赖搜索访问,建议你收藏【80小说网】 m.80xs.cc。我们将持续为您更新!
请勿开启浏览器阅读模式,可能将导致章节内容缺失及无法阅读下一章。