搜索: - 青梅
小背,你为什么不找他们聊聊呢?
IT江湖青梅2004-04-28 13:37:38
我看了一下链接的那篇文章,觉得基于统计的切分,可以增加频率比较,W1W2W3中如果W1W2和W2W3都是词,就看W1W2和W2W3哪个频率更高,也可以看NP全切分的权数积。
用得着google?
IT江湖青梅2004-04-28 12:13:38
我给你的那个加工计划可不是google来的。 你得告诉我详细的需求,应用环境,我才好确定你到底要一个什么东西。 别老变了。 另外,五万是统计语言模型的价格(而且还是成本价,不是市场价),分词系统,五万可下不来,你也好好考虑一下吧。 如果你是非常小的系统用,速度可以慢些的话,那么甚至可以用NP切最优,你多大系统用?
OK,明天告诉你我的决定
IT江湖青梅2004-04-28 11:42:11
再说了
IT江湖青梅2004-04-28 10:38:38
程序很难吗?比如说获得数据后的第一步,由文本文件加工到短句的。 抓下来的文本数据: 1.过滤广告; 2.压缩空格; 3.用回车替换码值在一定区间的字符(去除西文); 4.对得到的短句赋值和保留来源信息。 当然,开始的时候要有一些调整,主要是编码问题。
这举的例子是说明数据分析的重要
IT江湖青梅2004-04-28 10:33:11
先了解原料是什么状况,想要得到什么结果,然后有针对性地进行处理。你说呢? 我的邮件里有提到数据处理流程?根据设计的数据处理流程编写程序也是我的事? 可我看不到你做这件事的诚意啊,起码一点,我看不到你做这件事对你有什么好处,那么,你怎么会想做这件事呢? 我即使现学编程,也需要两天时间吧? 如果我买书回来学习,结果你不做,我岂不要哭了?...