土特产网站建设事业计划书体验营销
微软官网上发现一篇很有意思的文档:
教程:用于对图像进行分类的 ML.NET 分类模型 - ML.NET | Microsoft Learn
这篇教程写的很学院派,但有点碎,属于上课不能打一秒钟瞌睡的那种。好在还是给出了完整的代码:samples/Program.cs at main · dotnet/samples · GitHub
当然自己尝试前必要的先决条件还是要满足的。
1、用于训练的图片和两个tsv,以及最重要的模型文件要准备好。示例:samples/image-classifier-assets.zip at main · dotnet/samples · GitHub
2、模型文件也可以从这里下载:https://storage.googleapis.com/download.tensorflow.org/models/inception5h.zip
3、VS2022中,项目 -> 管理NuGet程序包 -> 浏览,添加如下四个包:
Microsoft.ML
Microsoft.ML.ImageAnalytics
Microsoft.ML.TensorFlow
SciSharp.TensorFlow.Redist
严格按照教程顺利跑通。本着能偷懒就偷懒的原则,开始对代码进行简化:
1、训练图集和tsv就暂先都直接硬编码了。实践证明如果所有文件在同一个目录下是没问题的:
static readonly string _imagesFolder = @"D:\temp\ForTraining";
static readonly string _trainTagsTsv = @"D:\temp\ForTraining\tags.tsv";
static readonly string _testTagsTsv = @"D:\temp\ForTraining\test-tags.tsv";
static readonly string _inceptionTensorFlowModel = @"D:\temp\ForTraining\tensorflow_inception_graph.pb";
否则按照文档的说法还要修改这些文件的复制属性。直接给出绝对路径可规避这个问题。
在“解决方案资源管理器”中,右键单击资产目录和子目录中的每个文件,再选择“属性”。
在“高级”下,将“复制到输出目录”的值更改为“如果较新则复制” 。
2、 Demo里并未给出保存训练好的模型的代码。这意味着每次执行都要重新训练一次,效率比较低。所以稍微优化了一下代码:
public static ITransformer GenerateModel(MLContext mlContext)
{// 略// ......// 保存训练好的模型mlContext.Model.Save(model, trainingData.Schema, "model.zip");return model;
}
3、图片识别的代码另起了一个项目(原项目中屏蔽掉ClassifySingleImage相关代码),同样要导入那堆NuGet:
static void Main(string[] args){if (args.Length == 0){Console.WriteLine("请输入预测的图片路径。");return;}string fn = args[0].Trim();if (!File.Exists(fn)){Console.WriteLine("文件不存在。");return;}// Create MLContext to be shared across the model creation workflow objectsMLContext mlContext = new();// 识别模式// 训练好的模型文件可复制到指定位置DataViewSchema modelSchema;// Load trained modelITransformer model = mlContext.Model.Load(@"D:\temp\ForTraining\model.zip", out modelSchema);// <SnippetCallClassifySingleImage>ClassifySingleImage(mlContext, model, fn);// </SnippetCallClassifySingleImage>}public static void ClassifySingleImage(MLContext mlContext, ITransformer model,string _predictSingleImage){// 无需修改,略// ......}/// 略
所以,接下来开发一个工具,用来生成tags.tsv和test-tags.tsv。嗯,思路已经有了。