请教怎么配置discuz的全文搜索

请教怎么配置discuz的全文搜索,第1张

说明

1、本人只在31版本下修改成功,其它版本并没有测试,但原理相同。

2、当数据量大时,全文搜索将非常耗费服务器资源,请慎用。

起因

系统默认只按标题搜索,由于标题字数有限,并且有的会员在发贴时并不会在提炼关键词内容多时搜索的作用就尤为重要,但往往搜索标题并不能搜到自己想要的内容,或遗漏了重要的内容,如果能搜索内容那搜索的重性就不言而喻,并且也能解决用户的烦恼,减少跳出率,好在论坛默认是支持搜索内容的,也就是全文搜索,只是出于性能的考虑默认并没有开启,下面一步一步来将其开启。

具体步骤

方法一

首先在后台用户用户组在相应要开启的用组的基本设置允许全文搜索中设置为是即可。

优点:可以自行设置要开启的用户组,方便灵活。

缺点:当然缺点也很明显,这项设置只在高级搜索中管用,并且只是在关键词输入框旁边多了一个复选框,提示要不要使用全文搜索,而且还是默认未勾选状态,这明显让菜鸟尤为抓狂,也会增加使用成本。

方法二

修改模板文件

先修改:/template/default/common/pubsearchformhtm文件;

<input type="hidden" name="srchtype" value="title" />

改成

<input type="hidden" name="srchtype" value="fulltext" />

这样在论坛头部的搜索就默认支持全文搜索了,但这并不彻底,因为点开的搜索结果页面如果换一个关键词再次进行搜索就又不默认支持全文搜索了,所以还要继续改模板文件:/template/default/search/pubsearchhtm;

<input type="text" id="scform_srchtxt" name="srchtxt" size="45" maxlength="40" value="$keyword" tabindex="1" x-webkit-speech speech />

在后面加上

<input type="hidden" name="srchtype" value="fulltext" />

然后再找

<input type="text" id="scform_srchtxt" name="srchtxt" size="65" maxlength="40" value="$keyword" tabindex="1" />

在后面加上

<input type="hidden" name="srchtype" value="<!--{if !empty($srchtype)}-->$srchtype<!--{else}-->fulltext<!--{/if}-->" />

这样就保证不管在那里搜索都默认开启全文搜索功能。

优点:用户体验好。

缺点:后台就算关闭了某用户组的允许全文搜索功能也对此方法无效,此文件一旦被修改,就是对所有用户都开启了允许全文搜索功能。

重点要 控制 发帖 , 看一下 我写的那个插件 百度搜索关键词“discuz x2如何批量管理回复贴?” 在discuz 官网论坛里 。适用于discuz!X2 UTF8版本。回复内容管理:快速查看最近的回复,方便管理用户; 帖子内容管理:快速的查看帖子的内容; 无效帖子回复清理:防止发贴机灌水; 指定用户小组的统计排行:员工工作量考核; 自动回复帖子:模拟用户发帖/回复,激活论坛人气。 创建用户游客在线: 模拟用户在线/游客,激活论坛人气。

关键词排名优化软件推荐点石。

点石关键词排名优化软件是一款能在短期内有效提高指定的词组、短语、句子等关键词百度排名工具。软件基于百度搜索用户行为分析研发而成,可用于网站关键词排名优化、提高网站有效流量等。

IE浏览器必须升级到80或以上版本,之后添加需要提高排名的关键词、需要提高排名的网站或域名、站内二次点击文字或链接,并可根据自己的宽带速度设置点击时间。注:切勿将软件用于违法关键词的优化,否则由此引发的任何法律问题将一律由使用者承担。

软件功能介绍

网站排名软件的内置功能很多,主要有黄页群发、分类信息群发、企业博客群建、邮件群发、主流英文博客群建、SNS博客群件等功能,这些功能将网站推广、共享和浏览是的网站更容易达到搜索引擎排名的效果。 以skycc网站排名软件的主要由三部分功能组成。

大型博客群发:专门针对大型博客网站自动群发高质量博客文章,从而建立高质量外链接,实现外部搜索引擎优化的功能。

博客群建:由多种博客结合于一体,对多种博客程序网站几十种互联网内使用人数最多的且高质量的博客程序网站。进行自动注册,自动群发文章,从而建立高质量外链接。内置5万多个网站,并可进行新数据自定义搜索。成功率高、效果明显,并且新的博客程序在不断更新升级中。对外链接的数量和持久度建设效果明显。

论坛群发和群顶:将您的信息发布到5万多个主流论坛种(包括著名的discuz、dvbbs、phpwind、leadbbs等)并自动注册,自动发帖,自动顶贴,成功率高,数量大,收录快是论坛群发的主要特点。对外链接的时效性和数量建设上效果突出。论坛群发+群顶功能对网站在搜索引擎中的排名尤为有效。

文章开始之前,给大家两条建议:

儿童送养 ”这个话题在大多平台都是极为罕见的,但知乎最近就因此爆发了一场危及平台声誉的危机。

内容审核就是这样一种职业,违法违规信息覆盖范围极广,新的违规信息层出不穷。无论你多么有经验、无论审核系统多么先进,只要发生问题,看起来都是很基础甚至很愚蠢的问题。

知乎这样一个有很强的技术实力和内容审核经验的平台,也会在这个问题上摔跟头,并且可以预料的是,不知道在多久的以后,知乎一定还会发生一次又一次因为存在违规内容带来的危机事件,这事情无可避免。有人说,对于内容审核人员来说这是从入门到被门槛绊倒,一点都不夸张。

读完这篇文章,你可以详细了解 文字类内容审核的逻辑 ,还会了解一些 和短视频审核的技术 ,足以补充一个运营或产品在这方面的知识储备了。

在不同公司,对审核类职位的划分标准不同,比如有 内容安全审核、内容推荐审核、内容质量审核 等类似职位。虽然在侧重点和具体操作上有所不同,但有许多逻辑都是共通的。为了避免文章过于复杂,我们在这里侧重最常见的 内容安全审核

不管是什么内容的审核,都应该包含以下 四个基础模块 :机器审核、人工审核、用户投诉审核、结果复审。

机器审核 ,是按照制定好的规则或机器学习算法对内容进行审核,通常,成熟的审核系统能将95%甚至99%以上的内容都自动审核并做出处理。确定有问题的会被自动删除,难以判断是否有问题的会被标注,进入人工审核程序。

人工审核 ,虽然用户投诉审核和结果复审大多时候也是人工审核,但这里所说的人工审核,特指审核机器无法判别的内容,通常占平台内容数量的比例不超过5%,但对于一些大型的内容平台,绝对数量已经很多了。在内容爆炸的时代,我们看到许多平台在全国都有多个审核中心,每个审核中心的员工数量都成千甚至上万。

用户投诉审核 ,是前两者的弥补,有很多违规内容以前没有出现过,所以不在规则可以过滤的范围内,或者非常隐蔽,规则难以严格过滤。用户的投诉是发现新问题的重要渠道。通过知乎的危机事件,我们更应该重视对投诉的审核,并及时据此对机器审核做出补充。

结果复审 ,通常采取抽查方式,比如通过复审机器删除的内容,看规则或算法是否过于严格;比如通过查看人工删除和通过的内容,看员工的工作是否按要求执行;比如通过内容的整体巡查,看是否存在新的问题未被注意到。

在文字类内容平台,比如知乎、、豆瓣以及各类论坛网站,机器审核主要是基于关键词过滤的逻辑,逻辑比较简单,但也没有想象的那么简单。

一篇文章发布到平台后,需要至少经历以下环节:

词语过滤的环节,关键词主要分为三类:

禁止关键词 ,只要匹配到这个词,内容就被自动删除或禁止提交。通常只有极少数词会被纳入禁止关键词,比如明确的色情、邪教以及广告的专属关键词。

审核关键词 ,这是最常见的关键词种类,只要匹配到就会自动进入后台进行审核,文章中的关键词会被高亮并罗列出来,有助于审核人员快速判断。审核关键词也应该尽量是专属关键词,以防止太多内容被拦截到后台。

替换关键词 ,在许多平台,我们会在文中看到莫名的 或 字母缩写 ,这可能不是文章作者写的,而是这个词被系统自动替换。平台不希望出现这个关键词,但用别的代替读者通常也能读懂。比如一些政治、宗教、不文明用语类词语,都有可能被自动替换。

当然,管理员在添加关键词时,很多时候并不是直接把关键词添加到后台。否则用户用很简单的方式就可以避过关键词过滤,比如在关键词内加一个空格,系统就难以匹配到。

所以,一般后台都会支持 限定符{x} 以限定相邻两字符间可忽略的文字,x 是忽略的字节数。在Discuz!网站后台有明确说明,如 "a{1}s{2}s"(不含引号) 可以过滤 " ass" 也可过滤 " axsxs " 和 " axsxxs " 等等。对于中文字符,若使用 GBK、Big-5 版本,每个中文字符相当于 2 个字节;若使用 UTF-8 版本,每个中文字符相当于 3 个字节。

另外,关键词还可以支持 正则表达式 ,来匹配具有一定模式的关键词,比如" /1\d{10}([^\d]+|$)/ "(不包括引号)用来匹配手机号码。正则表达式的内容过多,大家有兴趣可以搜索学习一下。

以上讲述的,主要是文字类内容的审核和规则,逻辑简单,但应用最为广泛。近年随着短视频类产品的兴起,内容审核的逻辑需要更加深层的技术支持。

技术上的东西,对大多人来说如同天书,而且也没有必要深入了解。我们挑选几个容易理解的点,来窥探几分内容审核背后的技术。

OCR(文本识别技术) ,主要用来识别中存在的文字。许多违规内容,包括****、色情信息、广告信息等为了规避审核,都会以的方式呈现。

人脸识别技术 ,通常用来识别政治、宗教类人物,识别到后可以直接删除或者进行风险标记。

语音识别技术, 语音识别的应用场景比较多,但在内容审核领域仍然不是刚需,所以使用的较少。但也有些直播或音频平台比较重视音频对比、声纹识别技术,可以轻易识别到一些固定模式的违法违规声音。

视频识别≈识别 ,视频是画面与音频组成的以帧为单位的画面,通常采取截帧上传与服务器数据对比来识别。审核模式和审核相同,比如通过画面皮肤裸露状态来判断是否过于性感、是否是色情内容。

上下文语义识别技术 ,这种技术用来判断一句话是否能跟上下文结合,是否是一段垃圾文本。比如说,在评论区随便输入一串奇怪的文本,如果系统认为和上下文不相关,就有理由将内容放入审核区。

技术是很酷,用好了可以大量减少我们的工作,但内容审核技术的实施是一件很难一劳永逸的事情,其中的尺度和参数都需要人来不断维护,而且人工审核仍然是非常有必要的,并且需要的人工可能越来越多。内容审核技术的应用,仍然任重道远。

1替代关键词不能太简单

我曾经在一款APP上看管理类文章,整篇文章多处说到给员工定绩效要遵循“ ART原则”,我迟疑了好几秒才明白,原来是" SMART原则"。

SM这个词只有两个字母,无论是作为禁止、审核还是替换关键词都不合适,都容易拦截或替换大量不应该处理的内容,一般的方法很难处理。

这时候,我们可以总结一下模式,如果sm这两个字母前面是英文字母,或者后面是英文字母,一般来说就是另一个英文单词,就不会有问题。我们就可以用正则表达式把这一规则写出来,再设置审核或替换就会好很多。

2审核时间与用户体验的权衡

去知乎和微博搜一下“审核”,被抱怨最多的问题就是 审核时间长 。用户提交内容到内容审核通过,这期间心情会剧烈波动,如果用户等了一两天时间,最后内容被莫名其妙地拒绝,而且不给任何明确的拒绝理由,用户的心情就会由期待变为焦虑,进而变成愤怒,这就是B站被up主抱怨最多的地方。

我们可以从以下角度优化用户体验:

3理解内容审核的保守倾向

越是体量很大的平台,内容审核越是有保守倾向,这不只是因为盘子大了更加在意风险管理,还有一些现实的原因。内容数量太多,平台就不得不采用规则和算法去审核,这些规则和算法需要最终做出决策,就难免拿着标准一刀切,即使这把刀很小也会有误伤,这种标准对很多内容就显得过于严格。

比如 皮肤裸露面积 达到多少会有问题、裸露哪些位置会有问题,无论标准多么的细化,都会存在误判,被误判的内容比例可能很小,但绝对数量很大。据说很多和视频中如果存在 加菲猫 ,都会被过滤掉,因为它**面积太大而且和人的皮肤很像。

在被审核的用户看来这些标准有点保守,有点不近人情,甚至可笑。平台的管理人员也知道问题,但他们很难做到很细致,为了快速把违规的内容剔除,只能牺牲掉一部分人的用户体验,毕竟违规内容一旦出现,对平台来说就是大问题。所以说,内容审核技术的应用还非常任重道远。

以上的内容,对于一个运营或产品工作者来说,已经足够了。但如果你真的需要对一款产品的内容审核规范负责,就需要去学习更多知识,需要有更加专业的精神和更谨慎的态度,未来还会有无数难以预料的坎坷等着你。

首先你要向百度提交你的网站,然后要定时定量更新你的网站,包括:

站外优化

A外链

B友情链接

C软文包装

站内优化

A长尾关键词词库建立:

工具:

1关键词挖掘网站5118

2百度相关搜索

3同行优秀网站

B内容制作:

根据整理的长尾词库,生产内容。

    一、从URL着手

     URl,全称 Uniform Resource Locator,中文为“统一资源定位器”。直观的说,就是地址栏里的内容。大多数论坛和社区的URL都至少包括下面三个单词之一:bbs、forum和club。所以,可以利用inurl语法。

     格式如下: “你想要查的内容 inurl:bbs”

                “你想要查的内容 inurl:forum”

                “你想要查的内容 inurl:club”

     深入下去,还可以发现论坛的各个帖子的URL都有相似的格式。

     对于Dvbbs,网页的URL一般是这种格式:

     http:/dispbbsaspboardID=&ID=&page=

     discuz! http:/viewthreadPHPtid=&fpage=

     PHPWind http:/readphptid=

     BBSxp http:/ShowPostaspid=

     所以,还能够搜索采用同样论坛系统的多个论坛里的内容,不过意义不大。使用

inurl:dispbbs、 inurl:boardID、inurl:viewthread、inurl:readphp、inurl:ShowPost、inurl:tid= ……

     二、关键词

     这里的关键词定位非常明确:要尽可能,最好仅仅出现在论坛里。

     1“powered by”

     不管采用Dvbbs还是Discuz!或者其他的程序,网页下面都有类似的文字“Powered by Discuz! 22F ”、“Powered By :Dvbbs Version 700”、“Powered by BBSxp 510 SQL”。“powered by”总是不可少,特异性也可以。所以,在搜索时,加上“powered by”可以大致限定在论坛内查找。

     2“文本方式查看主题”

     这主要针对DVbbs而言。用百度搜索 site:bbssowangcom 可以看到具体帖子在百度都被保存为文本页面形式。

     实例:搜索cnki的密码 “文本方式查看主题 cnkikw”

     补充:

     一、从URL着手

     inurl:printpage 和 inurl:print

     printpage的特异性很高,搜索结果大多都是论坛里的内容,但和“文本方式查看主题”有重叠之初。

     二、关键词

     “作者 发布时间” 或者 “作者 时间”

     用关键词““文本方式查看主题”“搜索的页面,都包含”作者“和”发布时间“。特异性不是太好,但查全率较高。

     其他有效的关键词我还没发现,欢迎大家交流。

刚接触SEO优化的新手们最多都是在外链推广专员,每天按照领导分配的量去发外链推广。大家都清楚的外链资源主要包括两大类:论坛资源和博客资源,做过一段时间的网站优化的SEO工作者是不是感觉发外链也不是那么简单的,好了不扯淡了。入正题,和大家一起交流下论坛外链资源的使用。

如何寻找自己想要的论坛推广资源

外链资源追求广泛性和相关性,这点大家都非常明白。但是如何找到行业相关的论坛资源呢笔者用的方法很简单:一是交换资源,二是用命令或工具寻找资源。当然还有其他方式,比如:domain一下也能找到很多外链资源。但是那些资源过于混乱,先说第一种方式:交换资源,和别人换资源是最简单、最直接的了。不过能找到同行并且可以换到资源也不容易,换来的外链资源通常也需要自己整理、筛选。第二种方式是用命令或工具寻找,那些搜索命令想必不用多说了,如果你懂一些程序的话,很容易写出精确到比较高的命令。譬如:论坛程序一般用的都是phpwind或discuz,那么就可以写出这样一个命令:

这个命令很简单就是搜索网页标题中包含:SEO和PoweredbyDiscuz这两个关键词的数据,而PoweredbyDiscuz是Discuz论坛的声明信息。很多Discuz论坛都会有保留的,phpwind论坛也是同一个道理。这样搜索到的结果就不上都是SEO论坛,但是我们还需要刷选权重比较高的论坛,对于权重很低的论坛就不要了。下面我推荐给大家一个工具可以帮助我们简单筛选下:

这是一个论坛搜索工具,也是我从网上找到的。虽然功能不算强大,但是用于寻找论坛资源还是挺不错的,软件界面也非常简单。在输入关键词的地方写几个关键词、选择关键词类型,最后点击“开始搜索”按钮即可,最重要的是免费的软件。其实很多SEO工作可以借助于辅助软件,这样可以节省时间、提高工作效率。

如何利用好自己的论坛资源

一般权重比较高的论坛,新注册的用户是不给带锚文本签名的,做论坛外链无非是论坛签名,当然也可以在论坛的制定板块发软文链接,很多SEO论坛都有外链专区。不过那些板块链接太多了,可想而知板块的权重很低。不要以为收录快的网站就代表权重高,这是两码事。所以说权重高的论坛资源得先养账号,等账号等级高了才能做锚文本的签名。也可以在论坛上的某个权重高的板块发软文链接,因为这些板块需要等级高才可以发。因此外链数量相对来说要少很多。越是难搞定的外链,往往质量越高。

论坛上还有一个值得做的工作:热门帖子,怎样让你的帖子成为热门贴呢热门贴不仅对收录有帮助,而且可以很好的推广你的产品。以SEO论坛为例,发一篇普通的软文帖子肯定没人关注,因为太多伪原创或转载的,也不是什么干货内容。有时候利用标题党的作用,效果倒是不错,或者分享一些实用的小软件,这些是大家喜欢的,再者可以根据SEO新闻合理的炒作一下。

不管什么类型的外链资源都有优势和劣势,从数量上来说论坛资源比博客要多。我们用的第三方博客资源也就那么几个,而博客资源养起来比较慢。特别是有些博客带锚文本的文章已经不易被收录了,我们整天大部分时间都在做外链建设。其实笔者感觉现在的百度算法已经做了很大调整,所以我们还是得把大部分时间放在站内上,尤其是内容的原创和内链布局。好了今天就聊到这,欢迎与我交流。

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
网站模板库 » 请教怎么配置discuz的全文搜索

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情