Categories
程式開發

云时代,何以安放我的个人数据


云时代,何以安放我的个人数据 1

大佬们常说,未来是数据的时代,这只是他们的论调。在商家眼里,数据是石油,我们是韭菜,数据只是便宜了他们更容易收割我们。但这的确是数据的黄金时代,通过对数据的收集整理分析,我们能比以往知道得更多,了解得更深刻,也学习得更快速。因此,每一份数据都值得被珍惜被守护,这其中就包括我们自己的个人数据。

对于绝大多数人而言,电脑硬盘就是存放个人数据的地方,默认且唯一。可是电脑硬盘有许多不方便的地方,比如电脑断电的时候,比如想跨地域使用的时候,比如想与他人分享的时候。更可怕的是硬盘是有使用寿命的,物理损坏就意味着部分数据可能永久丢失。想想自己数据的重要性,这实在谈不上是一种稳妥的数据存储方案。

2. 商业网盘方案

那在云和网络日益发达的今天,有什么更好的个人数据存储方案呢?可能有人会用到网盘,的确这是一个很好的数据存储 SaaS(Software as a Service) 方案,例如百度网盘,不光提供数据存储,在分享、下载、内容等方面都做得很好,甚至还可以直接在网页上听音乐、看视频、压缩文件等等,容量也足够大,对于普通用户而言几乎可以说是个完美的解决方案了。

云时代,何以安放我的个人数据 2

但是作为一种商业服务,各家的网盘还是有风险的,比如倒闭的风险:曾经各家都押宝的网盘市场,百度、阿里、腾讯、华为、360、金山、新浪、迅雷等等等等,如今叫得上名字的就只剩百度网盘了;还比如隐私的风险:在历次打击盗版的网络行动中,用户网盘里的文件都或多或少的会受到冲击,可服务商是如何判断文件版权的呢?除非数据被他扫描读取过。

3. 私人网盘方案

所以这次我想给大家推荐的方案是自行租用网络存储空间,搭建私人网盘。虽然这属于 PaaS (Platform as a Service)方案,但各家服务商已经包装得十分友好,因此不必担心操作上的困难。以阿里云为例,只需在阿里云主页上选择 OSS (Operation Support System)服务,创建 Bucket,再把文件扔上去就搞定了,十分傻瓜。并且作为一个 PaaS 服务,稳定和隐私也有相当的保证,如果再配合阿里云上其他一些软件服务,一定能让用户感受到比普通网盘更好的体验。

除了简单的搭建,我还想和大家讨论一下这种云存储方案使用上的一些技巧,并试图从这些技巧中以管窥豹的去看看云时代,数据管理和分析的趋势。

文件标签

初入 OSS 的朋友大多会选择 OSSBrowser 这款软件管理自己的云存储空间,操作起来就像在自己的电脑硬盘上一样,有文件夹有目录,非常熟悉的方式。可是如果对 OSS 有了更深入的了解就会发现,OSS 在逻辑上其实是没有文件夹这个概念的,所有的文件都堆放在一起,没有上下层级的区别,只是为了适应用户习惯,在 OSSBrowser 里加上了这个概念而已。

因此,当用户抛开 OSSBrowser 开始自行管理文件时,往往会因此造成许多混乱——所有的文件都堆放在一个大空间(Bucket)里,没有文件夹来进行分门别类,一副逼死处女座的节奏。但以往的文件夹管理模式真的是一种好的方式吗?这种沿袭于文件档案存储柜式的保管模式,不仅很容易造成文件的重复存储,还需要用户记住复杂的文件存储路径。如果只是需要管理少量的文件,或者有专业人员来操作(李彦宏在北大读的图书馆管理专业就是专门应对这类问题的),这种方式也许还能应付,但普通用户在面对海量个人文件时,这就未必是一种好的模式了。

云时代,何以安放我的个人数据 3

因此在 OSS 里,文件管理采用的是“标签”的方式。用户可以把 OSS 中的每个文件都打上一个或多个标签,通过标签来对文件进行分类。当用户需要找某个文件时,直接通过标签进行筛选。用户再无需记住文件存储路径,只需要记得文件有哪些属性,就可以很容易的找到。从管理文件存储路径,回归到文件属性本身,是云存储的一个趋势。

内容搜索

可即便是有了标签,在面对海量文件时仍会让人有力不从心之感,这时就可以借用“搜索”这个工具了。

有些用户在自己的电脑上可能使用过 Everything 或者 Listary 这类软件,对桌面搜索也不陌生——当使用这类软件时,只需在搜索框里输入文件名,或是文件名中的几个字,就能飞快的为你定位到该文件,十分便捷。可 OSS 上的文件搜索功能不止于此,不光是文件名,连文件内容也可以在用户授权的情况下,进行搜索。

云时代,何以安放我的个人数据 4

在这里需要介绍阿里云的另一个工具:大数据 MaxCompute。这个名词往往被传说得很离奇,但实际上现在个人也可以使用大数据工具对自己的个人数据进行管理和分析了。通过调用大数据工具对保存在 OSS 中的个人文件进行数据分析和整理,可以很容易的实现对文件内容的归档,在此基础上任意搜索一个文字内容,就可以很轻松的找到这些内容所在的文件了。

当然,对内容的搜索目前还仅针对于文件内容是文字的情况,但以往需要强大的后端服务器才能完成的各类功能,例如内容搜索,如今也可以在云存储上对个人用户开放了,这是云存储的另一个趋势。

人工智能

光有面向文字内容的搜索只能解决一部分问题,云存储想要做的还有更多,例如对图片和视频的分析整理。

使用 iPhone 的朋友在手机相册里都会有一个系统自动生成的“人物”相册,iPhone 会将手机里所有带人脸的相片按人脸分类归入不同的子相册中,这实际上是人工智能在对相片内容进行标注与分类。

云时代,何以安放我的个人数据 5

同样的,在 OSS 上也可以实现相同的功能,并且不光是人脸,还可以有其他更多的标注,例如建筑、汽车、风景、动物等等,甚至汽车的颜色、动物的名称、风景的季节统统不在话下。有了这些标注,你不光可以对相片进行分类,还可以调用搜索功能,更可以引入相片的地理位置信息和时间线,写一段专属自己的时光故事。也许某一天,你的云存储会告诉你这样一个故事:曾经,某年某月某日某时,你与某某相遇在了某地,那天你们穿着某种款式的衣服,一起去了某个地方,分享了某种美食。凡是过往,皆有印迹。

还有视频,通过对视频画面的分析,甚至视频中声音的分析,你既可以不用再浪费时间挨个查看,也不必担心漏过任何细节,通过调用阿里云人工智能平台 PAI 的工具集,统统为你搞定。

云上的各类服务,可以轻松的与云存储对接,并支持离线操作,这也是云存储的一个趋势。

4. 结语

所以你看,云存储并不仅仅只是存储,它更是各种增值服务的基础。当你把个人数据交托给了云存储,也意味着你从此打开了新世界的大门。

当然,这些服务可能是你不需要的,甚至抵触的,但这些服务背后所蕴含的趋势是必然的。希望你能看到这些趋势,并能顺顺而为,这就是我的初衷了。

云时代,何以安放我的个人数据 6

最后,容我以云计算作第一人称,稍稍修改莎士比亚的十四行诗,纪念这个时代。

如果我(云计算)活到可以写你的碑文

或是我生存到你在地里腐败

至彼时你音影长存

而我早已被遗忘

你名字将享永生

而我在云端

可是你长存在人们眼中

藉我静默的运转

万人聆听 万声唱颂

凡人死亡 你却永生

这是我作为存储的力量

云时代,何以安放我的个人数据 7