# Write your MySQL query statement below
1084. 销售分析III
Table: Product
+--------------+---------+ | Column Name | Type | +--------------+---------+ | product_id | int | | product_name | varchar | | unit_price | int | +--------------+---------+ Product_id是该表的主键。 该表的每一行显示每个产品的名称和价格。
Table: Sales
+-------------+---------+ | Column Name | Type | +-------------+---------+ | seller_id | int | | product_id | int | | buyer_id | int | | sale_date | date | | quantity | int | | price | int | +------ ------+---------+ 这个表没有主键,它可以有重复的行。 product_id 是 Product 表的外键。 该表的每一行包含关于一个销售的一些信息。
编写一个SQL查询,报告2019年春季
才售出的产品。即仅在2019-01-01
至2019-03-31
(含)之间出售的商品。
以 任意顺序 返回结果表。
查询结果格式如下所示。
示例 1:
输入:
Product table:
+------------+--------------+------------+
| product_id | product_name | unit_price |
+------------+--------------+------------+
| 1 | S8 | 1000 |
| 2 | G4 | 800 |
| 3 | iPhone | 1400 |
+------------+--------------+------------+
Sales
table:
+-----------+------------+----------+------------+----------+-------+
| seller_id | product_id | buyer_id | sale_date | quantity | price |
+-----------+------------+----------+------------+----------+-------+
| 1 | 1 | 1 | 2019-01-21 | 2 | 2000 |
| 1 | 2 | 2 | 2019-02-17 | 1 | 800 |
| 2 | 2 | 3 | 2019-06-02 | 1 | 800 |
| 3 | 3 | 4 | 2019-05-13 | 2 | 2800 |
+-----------+------------+----------+------------+----------+-------+
输出:
+-------------+--------------+
| product_id | product_name |
+-------------+--------------+
| 1 | S8 |
+-------------+--------------+
解释:
id为1的产品仅在2019年春季销售。
id为2的产品在2019年春季销售,但也在2019年春季之后销售。
id 3的产品在2019年春季之后销售。
我们只退回产品1,因为它是2019年春季才销售的产品。
原站题解
pythondata 解法, 执行用时: 556 ms, 内存消耗: 62 MB, 提交时间: 2023-09-17 10:38:16
import pandas as pd ''' 要找到符合要求的product_id有些麻烦 可以反向找到那些不符合要求的 不符合要求的 product_id : 销售记录里在 19 年之前或者 19年3月之后 使用一个筛选得到这样的黑名单 再进行反选,找到没问题的 product_id merge再去重即可 ''' def sales_analysis(product: pd.DataFrame, sales: pd.DataFrame) -> pd.DataFrame: black_list = sales.loc[('2019-01-01'>sales['sale_date']) | (sales['sale_date']>'2019-03-31'),'product_id'] sales = sales[~sales['product_id'].isin(black_list)] return pd.merge(product,sales,on='product_id')[['product_id','product_name']].drop_duplicates() def sales_analysis2(product: pd.DataFrame, sales: pd.DataFrame) -> pd.DataFrame: inValid = sales[(sales["sale_date"]<"2019-01-01")| (sales["sale_date"]>"2019-03-31")]["product_id"] Valid = sales[~sales["product_id"].isin(inValid)]["product_id"] df = product[product["product_id"].isin(Valid)] return df[["product_id","product_name"]] def sales_analysis3(product: pd.DataFrame, sales: pd.DataFrame) -> pd.DataFrame: #去掉没卖出去的产品 product = product[product["product_id"].isin(sales["product_id"])] #找出不符合日期的产品 sales["sale_date"] = pd.to_datetime(sales["sale_date"]) not_satisfied = sales[(sales["sale_date"] > pd.to_datetime("2019-4-1")) | (sales["sale_date"]<pd.to_datetime("2018-12-31"))] #从product里去除这些产品 return product[~product["product_id"].isin(not_satisfied["product_id"])][["product_id","product_name"]] def sales_analysis4(product: pd.DataFrame, sales: pd.DataFrame) -> pd.DataFrame: df = pd.merge(sales,product,on='product_id')[['product_id','product_name','sale_date']] tmp = df[(df['sale_date']>'2019-03-31') | (df['sale_date']<'2019-01-01')]['product_id'] df = df[~df['product_id'].isin(tmp)] df = df.drop(columns=['sale_date']) return df.drop_duplicates()
mysql 解法, 执行用时: 1020 ms, 内存消耗: 0 B, 提交时间: 2022-05-27 11:27:02
SELECT s.product_id, p.product_name FROM sales s LEFT JOIN product p ON s.product_id = p.product_id GROUP BY s.product_id HAVING MIN(sale_date) >= '2019-01-01' AND MAX(sale_date) <= '2019-03-31';