题目:
给定一个数组,数组每个位置的值表示该位置的权重,要求按照权重的概率去随机采样。
输入是一维正整数数组,表示权重;和一个包含指令字符串的一维数组,表示运行几次随机
采样。输出是一维整数数组,表示随机采样的整数在数组中的位置。
思路:
我们可以先使用 partial_sum 求前缀和(即到每个位置为止之前所有数字的和),这个结果
对于正整数数组是单调递增的。每当需要采样时,我们可以先随机产生一个数字,然后使用二分
法查找其在前缀和中的位置,以模拟加权采样的过程。这里的二分法可以用 lower_bound 实现。
以样例为例,权重数组[1,3]的前缀和为[1,4]。如果我们随机生成的数字为1,那么 lower_bound
返回的位置为 0;如果我们随机生成的数字是 2、3、4,那么 lower_bound 返回的位置为 1。
补充一些实战场景,以加深记忆(面试会加分吗 XD)
- Spring Cloud Ribbon (客户端负载均衡)策略中的
WeightedResponseTimeRule
- 此题可简述为「按权重,看作多个区间,按区间宽度越大,概率越大」
- 在 Ribbon 相关架构中,服务端给客户端一个服务列表,类似
Map<String, Set<String>>
结构。若客户端想调用key = serviceA
,可选的具体服务端实例有Set<String>
的["/svc/a1", "/svc/a2", "/svc/a3"]
,由客户端自行决定 - Ribbon 作为客户端负载均衡来帮助客户端选择去哪个具体服务实例(
a1
/a2
/a3
),希望雨露均沾,又希望别运气不好抽到响应慢的服务器,故有了一种根据权重的均衡策略 - 权重是通过定时统计最近一段时间内,
a1
/a2
/a3
各自的访问响应时间如何,如a1: 10ms
,a2: 20ms
,a3: 40ms
- 通过算法(不赘述,有兴趣可留言喔)计算得
a1: [0, 60]
,a2: (60, 110]
,a3: (110, 140]
的区间对应 - 下次再需要访问
serviceA
时,随机一个数[0, 140]
,看落在哪个区间,就选那个实例
- RabbitMQ 的 Topic 交换器使用
Trie
匹配 - MySQL 中的
IN
语法涉及二分算法
class Solution {
List<Integer>psum = new ArrayList<>();
int tot=0;
Random rand = new Random();
public Solution(int[] w) {
for(int x : w){
tot+=x;
psum.add(tot);
}
}
public int pickIndex() {
int targ = rand.nextInt(tot);
int low=0;
int higth=psum.size()-1;
while(low!=higth){
int mid = (low+higth)/2;
if(targ>=psum.get(mid)){
low=mid+1;
}else{
higth=mid;
}
}
return low;
}
}
/**
* Your Solution object will be instantiated and called as such:
* Solution obj = new Solution(w);
* int param_1 = obj.pickIndex();
*/