赞
踩
这次分享药材数据可视化系统的设计与实现,主要针对各类药材数据做一个统计分析可视化。
Django+爬虫+Hadoop、Spark数据清洗与可视化
数据库:MySQL
Python版本:3.7
Django版本:4.2.2
- import numpy as np
- import pandas as pd
- from sklearn.feature_extraction.text import TfidfVectorizer
- from sklearn.model_selection import train_test_split
- from sklearn.ensemble import RandomForestClassifier
-
- # 加载中药数据集
- data = pd.read_csv('chinese_medicine.csv')
-
- # 使用TF-IDF向量化中药功效描述
- tfidf = TfidfVectorizer(stop_words='chinese')
- tfidf_matrix = tfidf.fit_transform(data['efficacy'])
-
- # 构建推荐系统数据集
- X = tfidf_matrix.toarray()
- y = data['target_variable']
-
- # 划分训练集和测试集
- X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
-
- # 构建随机森林模型
- model = RandomForestClassifier(n_estimators=100, random_state=42)
-
- # 训练模型
- model.fit(X_train, y_train)
-
- # 使用模型进行预测
- predictions = model.predict(X_test)
-
- # 示例输出
- print(predictions)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。