>首页> IT >

谈谈信息挖掘

时间:2022-02-09 19:48:10       来源:虎嗅网

本文来自微信公众号:caoz的梦呓(ID:caozsay),作者:caozsay,题图来自:《超体》

众所周知,TK教主是搜索引证的达人,在技术高手的成长路线里,善于使用搜索引擎一定是最基本的能力诉求。

旧文也多次提过,有价值的信息往往碎片化,往往如面包屑隐藏在不同角落里,如何搜索,整理,判断,归纳,就显得尤为重要。

而信息越完整,关键决策的支持也就越完整,决策的准确性也就越高。

那么到底,怎样才算是信息挖掘?

前几天,我直播的时候,拿自己的习惯做了一个案例,但不知道什么原因,被系统以异常为由终止了直播。

友情提醒,本文所有内容仅为信息挖掘案例展示,不作为任何投资决策建议。

案例:

最近好奇大阪的房产投资,所以做了一些功课,跟大家分享一下我的信息采集和整理的思路。

第一,为什么考察大阪。

1. 相对于东京而言,大阪的房价只有1/3到1/2,但作为关西最大城市,以及热门旅游目标,其出租回报和东京的差距并没有房价那么悬殊。整体出租回报率,从表面来看,非常可观。该部分后续再展开。

2. 新加坡的银行可以为客户购买大阪房产提供贷款,并且有一定利率优势。

3. 日本法律相对规范,代理机构相对可信任,政局相对稳定,相对于东南亚地区的一些新兴小国,长期风险相对可控。

4. 疫情期间,有一定的低估价值,疫情结束后,存在报复性旅游的可能性。除了中国游客外,无论是东南亚游客,还是欧美游客,都有非常多人热衷于大阪旅游。

这里,1和2属于基本信息的采集,其中存在一定的道听途说,需要进一步的核对和验证。而3和4属于基本认知和常识。当然,有人如果不承认这是常识,没关系,此部分仅作案例完整性陈述使用,不争论。

第二,如何搜索房源。

搜索海外资源,默认谷歌。

如果用中文搜索,多半会发现一个中文日本房产平台,那么用英文搜索,也会找到一些当地的房产网站,但这些是否是最完整的呢?

换一种搜索方式,搜索“日本最大的房产网站”,找到一些讨论是suumo。不过是全日文的,也就是正常情况下我们是搜索不到的,那么全日文网站能不能使用,当然能,因为有“谷歌翻译”,在Chrome浏览器右键即可全站翻译。基本内容理解起来是没有问题的。

对比房源,确实比中文平台内容充实。

不同平台的房源有些是重复的,但有些也是各自平台独有的。

第三,关于信息深挖。

找到了房源信息,价格,地段,面积,是不是就可以做出足够的对比了,这仅仅是开始。

这里补充一句,关于房产持有的税费,很容易搜索到,属于基本信息,不赘述。

3.1 搜索不同城区的房价对比和区域特征对比。

红灯区房价相对很低,治安也相对较差,流浪汉多。北区是新发展区,金融中心和信息产业。

大阪大学所在是北部。东区外国人较多。

中央区,浪速区,天王寺区属于传统旅游和商业区域,游客较为集中,等等。

以上,搜索“大阪城区房价对比”,能找到不少。

3.2 不同区域人群构成和政治倾向构成。

非常有意思,我还查了“大阪特区公投”的倾向性分布图,这个有一定代表性,可以了解不同区域主要居民,是偏向革新,还是偏向保守,那么这也会多少影响到该区域未来的发展活力。

3.3 不同区域的房租对比。

房价对比和房租对比,可以更好的理解租售回报的比例。

这些是基本信息,也是很多人可以想到的,但这些足够了么?

并不够,其实房源信息里提及的很多关键词,要有好奇心,那么基于这些关键词,继续深挖,就会看到更多有价值的信息。

比如某些房源价格明显低于同地区行情价,那么通常都是有原因的。

3.4 所谓土地类型和最高容积率。

发现有第一类居住区,第二类居住区,商业区,工业区等等。

那么第一类是低密度优质住宅区,第二类就普通一些,是不是第一类住宅区更好呢,未必。因为这种地块商业配套往往不够好。如果不是自住,而是出租给游客和普通人,可能不如第二类居住区方便。

商业区可以有更高的容积率,可以开店铺,通常价值更高,但是仔细阅读条款其实是有风险的,居住区的采光权是有一定保障的,但是商业区就不是了,所以如果不仔细调查周边,有可能是被高楼包围,暗无天日的地块。

3.5 所谓建筑许可。

防火区域,半防火区域,这个和普通区域区别在哪里。

日本一户建大部分是木造结构,成本较低,但是防火区域就不允许木造结构,只能做钢混结构,那么建造和改建成本都会比木造高很多。

再建筑许可。有些老房子是禁止再建的,因为不符合新的建造法,可能这种地块后续维护就比较烦,虽然也允许翻新,保留主体结构即可,但毕竟不能为所欲为的改造房产,特别是这种都是很老的结构,所以这种往往价格显著低于市场价。

3.6 谷歌卫星和谷歌街景。

看到房源信息和所在区域,要查看地图周边,那么谷歌街景和谷歌卫星其实是价值是非常巨大的。你只看地图,可能大概知道这个房产的位置和区域,但是街景可以看到周边的真实情况,比如前面提到的,采光,以及是否可能存在较多噪音污染。

还有很重要的一点,我也看到一些显著低于市价的市中心区域房源,那么用卫星地图和街景才注意到,背后是一些神社,而里面则是密密麻麻的墓地。换句话说,这个房子是无遮坟景房,这种你从公开的信息图片是看不到的,如果无法去现场考察,或者现场无法深度调查(比如只允许在前面参观,以租客的名义不允许进入内部查看视野),那么谷歌卫星非常有用的。

3.7 民宿许可。

大阪允许全年民宿营业,但这里有一个问题,所谓允许,其实是需要邻里同意才可以,而大部分公寓是禁止民宿进入的。

所谓许可,只代表该区域许可,不一定代表该房源许可。

3.8 城市发展规划和重点校区分布。

政府官方网站和官方报告其实是最直接的资源,当然,还是需要谷歌翻译。

以上这些,都是通过房源信息内容展示中不同的关键词,那么基于这些关键词不断组合搜索挖掘出来的。

当然,在搜索之后,可以再联系会中文的中介,对不明确的信息进行进一步的咨询,这时候,问出来的问题就会显得相对专业,别人也会认为你确实有足够的准备,当然也会认真对待你的问题。

3.9 其他。

比如说,日常维护和管理的成本,代管费用,比如说,出租市场的行情,当你觉得出租回报率很好的时候,别忽视潜在的空租率。

这些可以通过进一步沟通深度了解,而且可以多咨询不同的中介,互相印证。

今天啰嗦这些,回到最初话题,是不是说鼓励大家投资房产,绝对不是。

我旧文《关于海外置业,我泼点冷水》有提到。

今天的主题是,如何进行信息挖掘。

第一,好奇心很重要,你对某个领域有好奇,是驱动你深挖的动力源泉。

第二,学会寻找最有价值的信息源。信息源很重要,很多时候,有价值的信息存在于垂直领域的搜索平台里,你要先找到这个平台。

第三,对关键词敏感,浏览领域内文章,领域内信息的时候,看到有些关键词不是很理解,不是很明确,要去搜索确认。

这点极为关键,往往可以通过一个信息点,查阅的过程中不断发现新的关键词,不断扩展信息点,最后会成为很庞杂的知识树。

我旧文经常会留有一些面包屑,也就是某些关键词特征,有极少数的人可以通过自行搜索,拼凑出更多的丰富内容。也有人会说,我搜过了,找不到,其实很多是需要一些关键词组合,有些是内容提到的,有些可能需要脑补一下。比如你搜索什么领域的,那么特征关键词+领域标记词,可以很好地限定搜索范围,这本来应该是很常识的东西,但确实很多人并不擅长。

第四,多渠道信息比对,确定信息真伪,来源和完整性。有时候,某些渠道的信息不完整,可以通过识图搜索,或者其他关键词组合方式寻找其他渠道的同一信息,相互对照补充。

第五,建立信息之间彼此关联的逻辑。

比如前文所述,不同授权区域,不同建筑许可,不同周边环境对房价的影响因素等等。要建立一个关联影响的框架逻辑。

第六,必要的时候,寻求专业人士的见解。

前提是,做足功课。

你做足功课,别人也会重视你的咨询,比如前文所述,一个中介面对一个做足功课的咨询者,一定会认为对方有足够的交易意愿,当然会更积极的回复和交流。而且当发现对方有足够的信息储备,自然也不敢过于夸大其词。

互联网信息往往是碎片化的,那么你首先要明确,自己所期望的目标是什么,并建立最基本的目标逻辑框架。

比如房产投资,追求租金回报和追求升值,其底层逻辑是完全不同的,其所需要关注的信息重点也是完全不同的。

基本目标逻辑确认后,再根据所收集的信息,将各种影响及关联因素尽可能罗列,并且对每个影响因素的影响范围尽可能标注,并通过进一步的信息采集去修订。

当我们试图做出一些关键决策的时候,这些信息越完整,因素关系越清晰,对决策的效率越有意义。

《数据控新加坡买车记》,这也是一个范例,决策前的数据准备和信息挖掘。当时我劝身边朋友说,根据历史数据,COE会大涨,但是都没听我的,后来疫情特殊原因还下跌了一段时间,但很快就飙升了,从当时的推算逻辑来说,我的预判是没有问题的,疫情是个黑天鹅事件,仅仅是短时间影响。

做出重大决策、关键决策的时候,信息挖掘和采集都是非常重要的。然而现实中,很多人会一时头脑发热做出关键决策。此外,盲从所谓权威意见也是很危险的,甚至很多权威就是靠收割来实现其权威价值的。

最后,补充一句,以上案例所提到的信息采集,并不足以建立真正有效的决策支持。信息不对称所带来的风险依然存在。此外,世界多变,诸多黑天鹅因素会严重干扰决策效果。

本文来自微信公众号:caoz的梦呓(ID:caozsay),作者:caozsay

关键词: 科技资讯 商业评论 明星公司 动态 宏观 趋势 创业 精选