微信扫码
与创始人交个朋友
我要投稿
写在前面的话:创建属于自己的股票价格预测模型一定会让我们感到兴奋和满足!本文将提供一份详细的搭建指南,带领大家使用 Python 语言和一些库来构建专属于你个人的股票价格预测模型。您如果没有太多编程经验也不用担心,跟着我一步步来,你也能成功。
创建自定义股票预测模型的原因是多样的,这体现了投资者对市场的深入理解以及对个性化策略的追求。我认为主要原因体现在以下三个方面:
首先,市场是复杂多变的,传统的预测方法可能无法全面捕捉市场动态。通过构建自定义模型,投资者可以根据自己对市场的独特见解,将多种因素纳入考量范围,如宏观经济指标、公司财务状况、市场情绪等,从而更准确地预测股票价格的走势。
其次,自定义模型允许投资者根据自己的风险偏好和投资目标进行个性化调整。不同的投资者有不同的投资理念和策略,通过自定义模型,他们可以将这些理念融入预测过程中,制定出更符合自己需求的投资策略。
此外,自定义模型还具有一定的灵活性和可扩展性。随着市场环境和投资者需求的变化,投资者可以不断对模型进行优化和改进,以适应新的市场情况。这种灵活性使得自定义模型在应对市场变化时更加得心应手。
在深入了解代码之前,让我们先熟悉一下我们要用到的工具和库:
Python:我们将使用的编程语言。
Pandas:用于数据处理。
NumPy:用于数值运算。
Scikit-learn:用于构建和评估机器学习模型。
XGBoost 和 LightGBM:先进的增强技术,可提高准确性。
Yahoo Finance:雅虎财经,用于获取股票数据。
首先,您需要股票数据。下面介绍如何获取和准备数据:
import yfinance as yf
import pandas as pd
def load_data(ticker):
stock = yf.Ticker(ticker)
df = stock.history(period="1y")
df['Date'] = df.index
return df
要进行预测,就需要创建反映市场状况的特征。以下是一些可以使用的技术指标:
def bollinger_bands(close, window=20, num_std=2):
rolling_mean = close.rolling(window=window).mean()
rolling_std = close.rolling(window=window).std()
upper_bb = rolling_mean + (rolling_std * num_std)
lower_bb = rolling_mean - (rolling_std * num_std)
return upper_bb, lower_bb
def compute_rsi(close, window=14):
delta = close.diff()
gain = (delta.where(delta > 0, 0)).rolling(window=window).mean()
loss = (-delta.where(delta < 0, 0)).rolling(window=window).mean()
rs = gain / loss
return 100 - (100 / (1 + rs))
我们将使用各种模型和集合技术来获得最佳结果:
from sklearn.model_selection import train_test_split
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.ensemble import VotingRegressor
from sklearn.linear_model import LinearRegression
from sklearn.ensemble import RandomForestRegressor, GradientBoostingRegressor
from sklearn.svm import SVR
import xgboost as xgb
import lightgbm as lgb
models = {
'Decision Tree': DecisionTreeRegressor(random_state=42),
'Linear Regression': LinearRegression(),
'Random Forest': RandomForestRegressor(random_state=42),
'Gradient Boosting': GradientBoostingRegressor(random_state=42),
'Support Vector Machine': SVR(),
'XGBoost': xgb.XGBRegressor(random_state=42),
'LightGBM': lgb.LGBMRegressor(random_state=42)
}
def train_and_evaluate(X, y, selected_models):
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
scaler = StandardScaler()
if len(selected_models) > 1:
voting_regressor = VotingRegressor(
estimators=[(name, models[name]) for name in selected_models]
)
model = Pipeline(steps=[
('scaler', scaler),
('regressor', voting_regressor)
])
else:
model = Pipeline(steps=[
('scaler', scaler),
('regressor', models[selected_models[0]])
])
model.fit(X_train, y_train)
y_pred = model.predict(X_test)
mae = mean_absolute_error(y_test, y_pred)
mse = mean_squared_error(y_test, y_pred)
rmse = np.sqrt(mse)
r2 = r2_score(y_test, y_pred)
mape = mean_absolute_percentage_error(y_test, y_pred)
return mae, mse, rmse, r2, mape, y_test, y_pred, model
这种方法的强大功能之一是能够将多个模型组合成一个更强大的模型。这通常比单独使用任何一个模型都能带来更好的性能。下面介绍如何使用投票回归器组合模型:
训练好模型后,将其保存起来,这样就可以重复使用,无需重新训练:
import pandas as pd
import numpy as np
import yfinance as yf
import joblib
Load the trained model
model = joblib.load('trained_model.pkl')
…
def on_button_clicked(b):
global trained_model
with output:
clear_output()
selected_models = [checkbox.description for checkbox in model_checkboxes if checkbox.value]
if selected_models:
print(f"Running models: {', '.join(selected_models)}")
mae, mse, rmse, r2, mape, y_test, y_pred, trained_model = train_and_evaluate(X, y, selected_models)
print("\nModel Evaluation Metrics:")
print(f"Mean Absolute Error: ${mae:.2f}")
print(f"Mean Squared Error: ${mse:.2f}")
print(f"Root Mean Squared Error: ${rmse:.2f}")
print(f"R^2 Score: {r2:.4f}")
print(f"Mean Absolute Percentage Error: {mape:.2f}%")
print("\nSample of predictions vs true values:")
results_df = pd.DataFrame({'True Price': y_test, 'Predicted Price': y_pred})
display(results_df.head())
# Save the trained model
save_model(trained_model, 'trained_model.pkl')
else:
print("Please select at least one model.")
评估模型的性能对于了解其运行状况至关重要。以下是一些常见的指标:
平均绝对误差 (MAE):预测值与实际值之间的平均绝对误差。
平均平方误差 (MSE):预测值与实际值之间的平均平方误差。
均方根误差 (RMSE):均方根误差(MSE)的平方根,表示误差大小。
平均绝对百分比误差 (MAPE):预测值与实际值之间的平均绝对百分比误差。
mae = mean_absolute_error(y_test, y_pred)
mse = mean_squared_error(y_test, y_pred)
rmse = np.sqrt(mse)
r2 = r2_score(y_test, y_pred)
mape = mean_absolute_percentage_error(y_test, y_pred)
return mae, mse, rmse, r2, mape, y_test, y_pred, model
保存并加载模型后,您就可以用它来预测股票价格了。以下是如何使用训练后的模型预测未来股票价格的方法:
# Prepare a list to store predictions
predictions = []
# Check if the recent_data DataFrame has the correct number of columns
if recent_data.shape[1] != len(expected_features):
raise ValueError(f"Expected {len(expected_features)} features but got {recent_data.shape[1]}")
# Predict future prices
for _ in range(future_days):
# Predict the next day's price
prediction = model.predict(recent_data)
predictions.append(prediction[0])
# Create a new row for future prediction
new_row = recent_data.copy()
new_row.loc[0, 'Open'] = prediction[0]# Update the 'Open' feature for the new row
# Append new_row to recent_data
recent_data = pd.concat([recent_data[1:], new_row], ignore_index=True)
return predictions
想尝试创建自己的股价预测模型了吗?我建立了一个 Google Colab ,你可以在线试用代码,并可根据自己的需要进行定制,还能进一步在自己的模型中用任何您感兴趣的股票代码替换现有的股票。
建立自己的股价预测模型是一种非常有益的体验。您可以自定义模型的方方面面,从特征选择到使用的算法。通过灵活组合不同的模型和技术指标,您可以创建一个完全适合自己交易风格的工具。
自定义模型的优势:自建股票价格预测模型可以让用户根据个人需求和偏好进行定制,更好地理解不同因素如何影响股票价格,并有机会尝试创新的技术。
必要的工具和库:为了构建模型,需要掌握Python编程语言,并且熟练使用数据处理和机器学习相关的库,如Pandas、NumPy、Scikit-learn、XGBoost和LightGBM。
数据准备和特征工程的重要性:加载和准备数据是建模前的关键步骤,特征工程如添加技术指标可以帮助模型更好地反映市场条件。
多模型集成:通过结合多个模型,如使用投票回归器,可以提高模型的预测能力和鲁棒性。
模型评估指标:使用MAE、MSE、RMSE、R²分数和MAPE等评估指标来衡量模型的性能,帮助用户了解模型的优势和不足。
实践和定制:提供了实际的代码示例和Google Colab笔记本,鼓励读者动手实践,并根据自己的交易风格调整模型。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-12-21
全网最全ChatGPT财务分析提示词解决方案
2024-12-21
万字长文梳理基于LLM的Text-to-SQL发展进程
2024-12-20
从0到1解构数据问答系统架构:三层模型全解析
2024-12-19
博士眼镜 × 观远数据 × 飞书 | AI 和 BI 赋能业务实践
2024-12-19
传统水务如何借助AI完成智能化升级?一文看懂核心架构与实战应用!
2024-12-18
ChatBl有什么用,看这篇就够了!
2024-12-18
在Windows上使用RAGFlow+Ollama+Qwen2.5,搭建医疗问诊助手(附相关数据集和案例)
2024-12-16
LLM+数据分析,大模型的一个攻坚领域市场观察
2024-06-20
2024-06-14
2024-07-03
2024-06-06
2024-06-14
2024-06-21
2024-06-16
2024-06-07
2024-07-24
2024-10-09
2024-12-13
2024-11-19
2024-11-06
2024-10-25
2024-10-25
2024-10-25
2024-10-18
2024-10-09