全国服务热线
服务热线
当前位置: 首页 >
【更新】对不起大家qwq之前的正则表达式提取汉字和删人名的部分有点问题!!!现在已经修复过来了!!!口语语料库总有效字数10***62字!中国人说的“是”字最多。
不是“的”也不是“了”。
“的”仅仅排第三,“了”字甚至没有进前十。
这个问题不能直接照搬现有的字频数据啦。
既然题主问的是“中国人 说哪个字最多”,那么我们不能统计书面语语料,必须统计口语语料,甚至使用聊天记录都会有一定的偏差,因为我们打下的字不一定…。
苹果 6 月 10 日召开的 2025 年全球开发者大会「WWDC25」,有哪些值得关注的信息?
为什么现在大龄剩女越来越多了?
有哪些新生代没见过或者无法理解的 Red Hat Linux 9 时代的事情?
为什么MIPS架构的路由器CPU能实现比X86高很多的网络吞吐量?
如何评价杨立昆认为大模型只是对海量文本的模式进行复杂拟合,根本不懂意义?
如何评价陈楚生?
Windows上有没有一分多屏和多屏合一的软件?
5070ti什么时候才能回归正常价格?
QQ咨询
联系电话
微信扫一扫
返回顶部