DeepSeek创建妖股筹码峰筛选系统中,修正筹码集中度,不亏反赚?

有时候,不,是常常,deepseek会出现幻想,特别是它在不知道答案的情况,它不会承认自己不知道,而是以幻想的的结果对付你的问题。所以,在使用deepseek时,核实其答案对的正确与否,便是一个必要的操作了。不然,就不是我们在主宰deepseek作业的流程,而是被deepseek带入了一个死胡同里。

在前面的一篇文章中,我想利用deepseek建立一个一筹码峰筛选妖股的系统,其中给出的七个因子里,仅有一项是符合常识的,其余的部分都出现了致命的错误。

deepseek作对的只有筹码峰的聚焦度:

# 计算逻辑
cost_5 = np.percentile(recent['close'], 5)    # 5%投资者的成本价
cost_95 = np.percentile(recent['close'], 95)  # 95%投资者的成本价
concentration = (cost_95 - cost_5) / (cost_95 + cost_5) * 100

这和其他交易平台的聚焦度也是有出入的,其他平台的表述是这样的:90的筹码聚焦度为15.14%和70%筹码的聚焦度为8.23%,以及重叠度为40%。

显然不同,或者是deepseek已经在这里就出现了错误。

所以,对deepseek给出的答案,我们第一是人工复核的过程,然后是让deepseek进行自查核实,直到找到最准确的答案为止。


deepseek:核实复查筹码的聚焦度,然后修正妖股的筛选系统。

在deepseek自查核实后,他已经发现了几个问题:

主要问题:

1、指标方向不一致:三个子指标的含义和方向不统一

2、权重分配不合理:简单平均忽略了不同指标的重大性差异

3、概念混淆:价格波动范围被误用为聚焦度指标

4、缺乏归一化:不同量级的指标直接相加导致偏差

这里deepseek所说的三个子指标是成交量、价格区间和成本,这和我们以往使用的筹码聚焦度的三个子指标是完全一样的。也就是说,deepseek已经找到了根源上的东西,第一它的出发的指向应该是正确的,这样才能保证答案的准确。

deepseek在这里是别出心裁的,它特意给出了一个泛化版本的聚焦度计算的方式,有给出了一个精华版,然后又给出了一个专业性超级强的版本。当然,我认为这是deepseek面面俱到的回答的方式,而找出其中关键重大的点,就是我们要做的一个工作了。

且不多说,看一下deepseek最后修正版本的筹码聚焦度的计算方法:

先看一下deepseek计算之前的一个思考角度:

1、价格区间聚焦度(price_concentration): 计算的是价格范围相对于平均价格的比率,这个值越小,说明价格波动范围越小,可能筹码越聚焦?但实际中,价格波动小不必定代表筹码聚焦,可能是横盘整理,而筹码聚焦一般表现为大部分筹码堆积在狭窄的价格区间内,但价格波动范围可能并不小(列如主力控盘后拉升,价格波动大但筹码依旧聚焦)。所以这个指标并不准确

2、成交量聚焦度(volume_entropy): 使用信息熵,熵值越小表明成交量越聚焦(即成交量聚焦在少数几天)。但注意,成交量的聚焦并不直接等同于筹码的聚焦。筹码聚焦度我们更关注的是持仓成本聚焦在哪些价格区间,而不是成交量的时间分布。

3、成本分布聚焦度(cost_distribution): 使用HHI指数,但原代码中计算的是1-HHI,所以值越小表明越聚焦?实际上,HHI指数越大表明越聚焦,所以这里用1-HHI,那么值越小的确 表明越聚焦。

而这个思考在具体的计算中也得到了反映:

筹码峰形态聚焦度(统一方向):

def calculate_chip_peak_concentration_corrected(df, price_bins=20):
    """
    筹码峰形态聚焦度计算
    统一方向:值越小表明筹码峰越聚焦
    """
    prices = df['close'].values
    volumes = df['volume'].values
    
    if len(prices) < price_bins:
        return 50
    
    # 计算价格区间的成交量分布
    price_min, price_max = prices.min(), prices.max()
    price_range = price_max - price_min
    
    if price_range == 0:
        return 0  # 完全聚焦
    
    bin_volumes = np.zeros(price_bins)
    bin_edges = np.linspace(price_min, price_max, price_bins + 1)
    
    for i in range(len(prices)):
        price = prices[i]
        volume = volumes[i]
        bin_idx = np.digitize(price, bin_edges) - 1
        bin_idx = max(0, min(bin_idx, price_bins - 1))
        bin_volumes[bin_idx] += volume
    
    total_volume = bin_volumes.sum()
    if total_volume == 0:
        return 50
    
    # 分析峰值特征 - 统一方向:单一峰值得分低(聚焦),多峰值得分高(分散)
    peak_threshold = 0.1  # 峰值阈值10%
    major_peaks = bin_volumes[bin_volumes > peak_threshold * total_volume]
    
    if len(major_peaks) == 0:
        concentration = 100  # 没有明显峰值,高度分散
    elif len(major_peaks) == 1:
        # 单一主要峰值 - 高度聚焦
        peak_ratio = major_peaks[0] / total_volume
        if peak_ratio > 0.5:
            concentration = 20  # 单一强峰值
        else:
            concentration = 40  # 单一弱峰值
    else:
        # 多个峰值
        if len(major_peaks) <= 2:
            concentration = 60  # 2个峰值,适度聚焦
        elif len(major_peaks) <= 3:
            concentration = 70  # 3个峰值,相对分散
        else:
            concentration = 90  # 多个峰值,高度分散
    
    return concentration

deepseek将三个子指标统一方向之后(将三个子指标的计算过程忽略),筹码峰分布状况的,包括单峰,和多峰状况。

当然,如果需要一个完整复述,可以将以上内容复制到deepseek中进行翻译,就会完全没变其中的含义了。

我们简单祖宗一个示范的计算:

假设某股票60个交易日的收盘价在10-20元之间波动,我们将其分为5个价格区间:

价格区间:10-12元, 12-14元, 14-16元, 16-18元, 18-20
成交量分布:1000手, 8000手, 500手, 300手, 200
总成交量:10000手

计算过程:

  1. 峰值阈值:10000 × 10% = 1000手
  2. 主要峰值:只有12-14元区间(8000手 > 1000手)
  3. 峰值比例:8000/10000 = 80% > 50%
  4. 结果:返回20分(高度聚焦)

这表明该股票筹码高度聚焦在12-14元价格区间,具备妖股潜质。


这个筹码峰与以往筹码峰是不同的,这也是deepseek匠心独运的结果。

它的核心逻辑是:

该函数通过分析成交量在不同价格区间的分布特征来判断筹码的聚焦程度:

  1. 单一强峰值(20分):大部分成交量聚焦在单一价格区间
  2. 单一弱峰值(40分):有明显峰值但不够突出
  3. 双峰值(60分):成交量聚焦在两个主要价格区间
  4. 三峰值(70分):成交量分散在三个主要价格区间
  5. 多峰值(90分):成交量均匀分布在多个价格区间
  6. 无峰值(100分):成交量分布极其均匀

可以看出,deepseek将各种筹码峰的状况无一遗漏地打分,但这里是一个逆向的打分顺序,分值越低代表了筹码聚焦度越高,100分代表了五峰值的状况,而20分却代表了单一峰值,筹码的高度聚焦的现象。如果是20度的聚焦度,那么就是可能的妖股,如果是100峰值的聚焦度,就是一个无人问津的大众化的股票了。

以上是我们再次用deep将筹码的聚焦度修正为一个专业版本的模式过程。

但是,在前面,我们建立一个完整的筛选妖股系统需要至少七个因子指标,这里我们已经完成了两个指标的修正的过程,一个是换手率,一个是筹码峰,由于我们给deepseek提出的问题是,以筹码峰建立一个筛选妖股的系统,所以,筹码峰是为主的,其他如换手率的指标都是作为验证手段出目前系统中的。

而我们当初建立筛选妖股系统的原委是想得到一个高效率的系统,所以,筹码峰为主,其他指标为辅助,就会得到一个综合的系统,也是为效率而着想的。

当我们提供deepseek将每一个辅助的因子指标探讨清楚之后,我们就会建立的一个完整的筛选妖股的系统了。

虽然在前面的文章中,已经出现了一个利用deepseek所创建的筛选的系统,但是我们这里是做一个修正的工作,就是反复通过deepseek揉搓这些指标,使他们达到高度地契合,不发生矛盾,不产生不同指向,目的统一的系统,所以,我们将修正后的完整系统在后面的文章中揭示,期待这一切吧。

如果你有不同的观点,或者你发现了其计算筹码峰中的缺点,请你写在评论里,我们和deepseek一起去完成一个高效赚钱的系统模型吧~

© 版权声明
THE END
如果内容对您有所帮助,就支持一下吧!
点赞0 分享
评论 共3条

请登录后发表评论

    暂无评论内容