博客
关于我
BitMap的巧用(简单示例)Python
阅读量:371 次
发布时间:2019-03-05

本文共 946 字,大约阅读时间需要 3 分钟。

最近一周都没怎么更新博文,实际上也没有做什么有用的事情,感觉这样下去把自己刚刚开的头又半途而废了。唉!不能让自己生活在舒适圈啊,要努力学习,加油!

今天要说的是BitMap的使用,了解BitMap的人都知道BitMap可以在短时间内对海量数据去重,排序和查询,用处还是很大的。

一、BitMap简介

BItMap算法在中文里叫做位图算法,它是指内存中连续的二进制(bit)所组成的数据结构,该算法主要用于对大量整数做去重和查询操作。 BitMap的位运算是其另一个优势,拥有非常高的性能。 在使用BitMap时,我们需要先对自己存储的数据做一个估计,看看大约要申请多少位。

二、BitMap代码实现

class MyBitmap:    def __init__(self,size):        self.words=[0]*(self.get_word_index(size-1)+1) #因为get_word_index()函数返回结果是向下取整,所以需要 + 1        self.size=size    def get_bit(self,bit_index):        if bit_index<0 or bit_index>self.size-1:            raise Exception("超过Bitmap的有效范围!")        word_index=self.get_word_index(bit_index)        return (self.words[word_index]&(1<
self.size-1: raise Exception("超过Bitmap的有效范围!") word_index=self.get_word_index(bit_index) self.words[word_index] |= (1<
>6bitMap=MyBitmap(128)bitMap.set_bit(126)bitMap.set_bit(75)print(bitMap.get_bit(126))print(bitMap.get_bit(78))

转载地址:http://udvg.baihongyu.com/

你可能感兴趣的文章
NI笔试——大数加法
查看>>
NLog 自定义字段 写入 oracle
查看>>
NLog类库使用探索——详解配置
查看>>
NLP 基于kashgari和BERT实现中文命名实体识别(NER)
查看>>
NLP 模型中的偏差和公平性检测
查看>>
Vue3.0 性能提升主要是通过哪几方面体现的?
查看>>
NLP 项目:维基百科文章爬虫和分类【01】 - 语料库阅读器
查看>>
NLP_什么是统计语言模型_条件概率的链式法则_n元统计语言模型_马尔科夫链_数据稀疏(出现了词库中没有的词)_统计语言模型的平滑策略---人工智能工作笔记0035
查看>>
NLP、CV 很难入门?IBM 数据科学家带你梳理
查看>>
NLP三大特征抽取器:CNN、RNN与Transformer全面解析
查看>>
NLP入门(六)pyltp的介绍与使用
查看>>
NLP学习笔记:使用 Python 进行NLTK
查看>>
NLP度量指标BELU真的完美么?
查看>>
NLP的不同研究领域和最新发展的概述
查看>>
NLP的神经网络训练的新模式
查看>>
NLP采用Bert进行简单文本情感分类
查看>>
NLP问答系统:使用 Deepset SQUAD 和 SQuAD v2 度量评估
查看>>
NLP项目:维基百科文章爬虫和分类【02】 - 语料库转换管道
查看>>
NLP:从头开始的文本矢量化方法
查看>>
NLP:使用 SciKit Learn 的文本矢量化方法
查看>>