面试题:Python嵌套字典与集合在高效算法实现中的优化
假设有一个巨大的嵌套字典,代表一个电商平台的商品信息,结构如下:
```python
products = {
'category1': {
'product1': {'price': 100, 'ratings': [4, 5, 3, 4], 'reviews': {'user1': 'Good product', 'user2': 'Not bad'}},
'product2': {'price': 150, 'ratings': [3, 4, 4], 'reviews': {'user3': 'Great', 'user4': 'Average'}}
},
'category2': {
'product3': {'price': 200, 'ratings': [5, 5, 4], 'reviews': {'user5': 'Excellent', 'user6': 'Top - notch'}}
}
}
```
1. 编写一个高效的算法,计算每个类别的商品平均价格,要求在处理大量数据时尽量减少内存占用和时间复杂度。
2. 利用集合的特性,找出所有评论中出现频率最高的前10个单词,同时优化算法以提高效率,考虑如何处理大量评论数据时的性能问题。