2025-02-23 手机 0
在科技馆的深处,藏着一本神秘的书籍——《Python自动化办公应用大全-ChatGPT版》。为了揭开这本书的面纱,我们举行了一场封面评选活动,让读者们投票和留言表达他们对不同封面的喜好。但当A和B两种设计方案获得了相似的高票数时,出版社和作者团队陷入了难题,他们需要一个方法来快速分析几百条留言,以便做出决策。
在数据统计上,这些投票只能被视为抽样,而我们无法确定哪些小伙伴参与了投票,因此这些数据并不代表全貌。不过,留言中的客观与主观见解则提供了宝贵的信息。在这样的情况下,如果能将所有留言整理、归纳,就能更准确地理解读者的看法,从而辅助决策。
然而,当面对几百条留言时,用肉眼进行查看并非易事。人脑的内存有限,不仅容易遗忘前文,也可能错过重要内容。而从大量纯文本数据中提取有价值信息,则是“文本挖掘”的一项挑战,这也是数据分析的一部分。在这个过程中,分词是一个关键步骤,它涉及将长篇大论合理分拆成单个词语。这一步不仅要求精准,还要考虑到中文语言复杂多变。
完成分词后,可以进行词频统计、逻辑关联等其他统计与分析,并通过生成词云图等方式了解重点关键词及其关系。但对于我们的需求来说,更高级别的挖掘——即语义理解,是目前AI领域强项之一。
因此,我们基于ChatGPT 3.5自定义了一个嵌入式应用,将我们的留言数据上传成为专用数据集,然后请ChatGPT帮助我们分析。如果标准款的ChatGPT只是普通神仙,那么微调或嵌入技术使得ChatGPT应用就如同带着高级法宝的大罗金仙一样强大。未来,每个人都可能需要调教出自己的专属AI助手,而懂一些代码知识是非常必要的,因为当前市面上的所有大语言模型都支持用Python调用,这给予了Python一种前瞻性能力,使其成为实现未来的编程语言之一。
未来的办公环境极有可能由各种带AI软件个性化AI总管来帮助个人完成任务,有编程基础的人自然能够比其他人更方便地定义出既可靠又强大的AI总管。你说呢?