登录
首页精彩阅读批量数据采集过程中方差的计算
批量数据采集过程中方差的计算
2018-03-09
收藏

批量数据采集过程中方差的计算

最近项目用需要判断开始数据是否稳定,即采集到的数据是否符合期望,我用方差来判断采集到的数据是否稳定。有两种判断方法:第一种是数据不断的进来,我累积的进行方差计算;第二钟是利用滑动窗口的思想,数据个数达到窗口大小时计算方差值,采用循环数组的模式来实现此功能。

第一种实现方法就是采用迭代式的思想进行方差计算。我实在网上看到一位大神的博客中有对此方法的描述,他用matlab代码进行了说明,,我用C语言实现了;下面附上代码:
[cpp] view plain copy

    double GetVariance(uint64_t value)  
    {  
        static uint8_t cnt = 0;  
        static double Var = 0;  
        static double Esp = 0;  
        double TempValue = 0;  
          
        cnt = cnt + 1;  
        if(cnt == 1)  
        {  
            Var = 0;  
            Esp = value;  
            return Var;  
        }  
        TempValue = value - Esp;  
        Esp = (value + Esp*(cnt - 1))/cnt;   
        Var = Var + TempValue*(value - Esp);  
        return (Var/cnt);  
    } 
这样在程序中不断调用该函数即可迭代式的计算出方差,而不需要知道数据的个数。
第二种方法是采用滑动窗口的思想,这里需要说明一下,我做的时候有两种情况,一种是窗口不动,数据不断前移,FIFO,这种实现起来最简单;还有一种情况是窗口向前移动,这种实现起来就比较复杂了,我用单步调试好多次,才搞清楚之间的区别。
(1)窗口不动,数据前移:

[cpp] view plain copy

    double Function(uint16_t value)  
    {  
        static uint8_t cnt=0;  
        static uint8_t len=7;  
        static uint16_t sample[7]={0};  
        uint8_t i=0;  
        double var;  
        if(cnt < len)  
        {  
            sample[cnt++] = value;  
            return 0;  
        }  
        else  
        {  
            for(;i+1<cnt;i++)  
            {  
                sample[i]=sample[i+1];  
            }  
            sample[i]=value;  
            var=Variance(sample,7);  
    }  
    }  
其中 Variance()是我写的计算方差函数,这样就实现了滑动计算数据方差值。
(2)窗口前移,这种实现数据的滑动,设定好窗口大小后,按照FIFO原则,数据不断进入出去,但是这种实现数据滑动后对计算方差增加了难度,这里只说出如何实现窗口向前滑动的代码:
[cpp] view plain copy

    void Function(uint16_t value)  
    {  
        static uint8_t cnt=0;  
        static uint8_t len=7;  
        static uint8_t index=0;  
        static int order[7]={0};  
        static int sample[7]={0};  
        uint8_t i=0;  
          
        sample[index] = value;  
        if(cnt < len)  
        {  
            cnt++;  
        }  
        else  
        {  
            for(i=0;i<cnt;i++)  
            {  
                if(order[i] == index)  
                break;  
            }  
            for(;i+1<cnt;i++)  
            {  
                order[i]=order[i+1];  
            }  
        }  
          
        order[cnt-1] = index;  
        index=(1+index)%len;  
    }  


最后把计算方差的函数Varanice()代码列出来:
[cpp] view plain copy

    double Variance(uint16_t data[], uint8_t n)  
    {  
        double mean = 0, divisor;  
        uint16_t sum = 0,Varian = 0;  
        uint8_t i;  
      
        for(i=0;i<n;i++)  
        {  
            sum = sum + data[i];  
        }  
        mean = sum/n;  
        for(i=0;i<n;i++)  
        {  
            Varian = Varian + pow(data[i]-mean,2);  
        }  
          
        /*程序中divisor是自由度,20是小样本判断的一个标准。如果是小样本的话,约束较大,
            自由度就要减一;如果是大样本的话,自由度为样本个数。*/  
        if(n<20)  
        {  
            divisor = n-1;  
        }     
        else  
        {  
            divisor = n;  
        }  
        return (Varian/divisor);  
          
    } 
以上代码如有错误还望指正,共同进步

数据分析咨询请扫描二维码

客服在线
立即咨询