In [9]:
import pandas as pd
import numpy as np
import networkx as nx
from sklearn.metrics.pairwise import cosine_similarity

def generate_graph_modality(file_path, threshold=0.2):
 # Read the uploaded file containing user-item ratings
 ratings_df = pd.read_csv(file_path) # Assuming CSV format, adjust accordingly if different

 # Compute user-item matrix
 user_item_matrix = pd.pivot_table(ratings_df, values='rating', index='user_id', columns='business_id', fill_value=0)

 # Compute cosine similarity between users
 user_similarity_matrix = cosine_similarity(user_item_matrix)

 # Convert similarity matrix to binary adjacency matrix
 binary_adjacency_matrix = np.where(user_similarity_matrix > threshold, 1, 0)

 # Convert binary adjacency matrix to a list of tuples for graph modality
 graph_modality_list = []
 for i in range(len(user_item_matrix.index)):
 for j in range(i + 1, len(user_item_matrix.index)):
 if binary_adjacency_matrix[i][j] == 1:
 graph_modality_list.append((user_item_matrix.index[i], user_item_matrix.index[j], 1.0))

 return graph_modality_list

# Example usage:
file_path = "../data/rating_final.csv" # Update with the actual file path
graph_modality_list = generate_graph_modality(file_path)
trust_graph_df = pd.DataFrame(graph_modality_list)
# print("Graph Modality List:")
# print(graph_modality_list)
print(len(trust_graph_df))

124033


In [10]:
import cornac
from cornac.eval_methods import RatioSplit
from cornac.models import BPR, MF, NeuMF, VAECF, CVAECF, BiVAECF, LightGCN, WBPR, WMF
from cornac.metrics import NCRR
from cornac.data import GraphModality
import pandas as pd

# Assume data is a Cornac dataset object
# data = cornac.data.Dataset.from_uir(your_data)

# Model parameters
LATENT_DIM = 50
ENCODER_DIMS = [20]
ACT_FUNC = "tanh"
LIKELIHOOD = "gaus"
NUM_EPOCHS = 5
BATCH_SIZE = 128
LEARNING_RATE = 0.01

SEED=4567
VERBOSE=True

df = pd.read_csv('../data/rating_final.csv')
data_list = df.values.tolist()

eval_metrics = [
 cornac.metrics.Recall(k=10),
 cornac.metrics.NDCG(k=10),
 cornac.metrics.NCRR(k=10),
]

user_graph_modality = GraphModality(data=graph_modality_list)

# Split the data
ratio_split = RatioSplit(data=data_list, val_size=0.2, test_size=0.2, 
 user_graph=user_graph_modality,
 exclude_unknowns=True, seed=SEED, verbose=True)

# Define models
models = [
 BPR(k=50, learning_rate=0.01, lambda_reg=0.01, max_iter=100),
 WBPR(k=50, max_iter=100, learning_rate=0.001, lambda_reg=0.01, verbose=True),
 MF(k=50, learning_rate=0.01, lambda_reg=0.01, max_iter=100),
 WMF(k=50, max_iter=155, a=1.0, b=0.1, learning_rate=0.00555, lambda_u=0.0155, lambda_v=0.0155,
 verbose=VERBOSE, seed=SEED),
 NeuMF(num_factors=50, layers=(64, 64, 32, 16), act_fn='relu', reg=0.01, num_epochs=5, 
 batch_size=128, num_neg=4, lr=0.01, learner='adam', trainable=True, verbose=True, seed=SEED),
 VAECF(k=50, autoencoder_structure=[20], act_fn='tanh', likelihood='pois', n_epochs=5, batch_size=128),
 # LightGCN(seed=SEED,emb_size=64,num_epochs=5,num_layers=3,early_stopping={"min_delta": 1e-4, "patience": 50},batch_size=128,
 # learning_rate=0.01,lambda_reg=0.01,verbose=True),
 CVAECF(z_dim=50,h_dim=20,autoencoder_structure=[40],learning_rate=0.01,n_epochs = 50,batch_size = 128,seed = SEED),
 BiVAECF(k=LATENT_DIM,encoder_structure=ENCODER_DIMS,act_fn=ACT_FUNC,likelihood=LIKELIHOOD,n_epochs=50,batch_size=BATCH_SIZE,
 learning_rate=LEARNING_RATE,seed=SEED,trainable = True,use_gpu=True,verbose=True)
]

# Count the total number of unique users and unique businesses
num_users = df['user_id'].nunique()
num_businesses = df['business_id'].nunique()

# Calculate the total number of possible ratings
total_possible_ratings = num_users * num_businesses

# Count the actual number of ratings in the dataset
num_ratings = len(df)

# Calculate the sparsity of the data
sparsity = 1 - (num_ratings / total_possible_ratings)

print("Total number of users:", num_users)
print("Total number of restaurants:", num_businesses)
print("Total possible ratings:", total_possible_ratings)
print("Actual number of ratings:", num_ratings)
print("Sparsity of the data:", sparsity * 100)


# Evaluate models
cornac.Experiment(eval_method=ratio_split, models=models, metrics=eval_metrics, verbose=True).run()


rating_threshold = 1.0
exclude_unknowns = True
---
Training data:
Number of users = 10999
Number of items = 4922
Number of ratings = 176857
Max rating = 5.0
Min rating = 1.0
Global mean = 3.8
---
Test data:
Number of users = 10999
Number of items = 4922
Number of ratings = 58885
Number of unknown users = 0
Number of unknown items = 0
---
Validation data:
Number of users = 10999
Number of items = 4922
Number of ratings = 58902
---
Total users = 10999
Total items = 4922
Total number of users: 11000
Total number of restaurants: 4963
Total possible ratings: 54593000
Actual number of ratings: 294763
Sparsity of the data: 99.46007180407744

[BPR] Training started!


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 100/100 [00:01<00:00, 51.29it/s, correct=84.93%, skipped=0.81%]


Optimization finished!

[BPR] Evaluation started!


Ranking: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10561/10561 [00:02<00:00, 4182.97it/s]
Ranking: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10534/10534 [00:02<00:00, 4405.11it/s]



[WBPR] Training started!


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 100/100 [00:01<00:00, 50.09it/s, correct=50.72%, skipped=3.02%]


Optimization finished!

[WBPR] Evaluation started!


Ranking: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10561/10561 [00:02<00:00, 4141.18it/s]
Ranking: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10534/10534 [00:02<00:00, 4526.76it/s]



[MF] Training started!


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 228.21it/s, loss=1346.61]


Optimization finished!

[MF] Evaluation started!


Ranking: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10561/10561 [00:02<00:00, 4127.18it/s]
Ranking: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10534/10534 [00:02<00:00, 4469.11it/s]



[WMF] Training started!


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 155/155 [01:10<00:00, 2.20it/s, loss=301]


Learning completed!

[WMF] Evaluation started!


Ranking: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10561/10561 [00:12<00:00, 848.89it/s]
Ranking: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10534/10534 [00:12<00:00, 876.97it/s]



[NeuMF] Training started!


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:46<00:00, 9.23s/it, loss=0.501]



[NeuMF] Evaluation started!


Ranking: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10561/10561 [00:19<00:00, 542.52it/s]
Ranking: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10534/10534 [00:18<00:00, 566.23it/s]



[VAECF] Training started!


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:06<00:00, 1.22s/it, loss=1.17]



[VAECF] Evaluation started!


Ranking: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10561/10561 [00:03<00:00, 2717.43it/s]
Ranking: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10534/10534 [00:03<00:00, 2860.03it/s]



[CVAECF] Training started!


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 50/50 [01:31<00:00, 1.84s/it, loss=0.93]



[CVAECF] Evaluation started!


Ranking: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10561/10561 [00:05<00:00, 1832.24it/s]
Ranking: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10534/10534 [00:05<00:00, 1897.65it/s]



[BiVAECF] Training started!


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 50/50 [01:42<00:00, 2.06s/it, loss_i=0.441, loss_u=0.191]



[BiVAECF] Evaluation started!


Ranking: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10561/10561 [00:02<00:00, 4216.96it/s]
Ranking: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10534/10534 [00:02<00:00, 4669.25it/s]


VALIDATION:
...
 | NCRR@10 | NDCG@10 | Recall@10 | Time (s)
------- + ------- + ------- + --------- + --------
BPR | 0.0377 | 0.0413 | 0.0468 | 2.3963
WBPR | 0.0297 | 0.0333 | 0.0399 | 2.3315
MF | 0.0040 | 0.0043 | 0.0042 | 2.3616
WMF | 0.0489 | 0.0541 | 0.0632 | 12.0190
NeuMF | 0.0013 | 0.0014 | 0.0015 | 18.6082
VAECF | 0.0347 | 0.0383 | 0.0445 | 3.6877
CVAECF | 0.0545 | 0.0615 | 0.0739 | 5.5564
BiVAECF | 0.0002 | 0.0002 | 0.0002 | 2.2606

TEST:
...
 | NCRR@10 | NDCG@10 | Recall@10 | Train (s) | Test (s)
------- + ------- + ------- + --------- + --------- + --------
BPR | 0.0425 | 0.0456 | 0.0502 | 1.9605 | 2.5325
WBPR | 0.0332 | 0.0365 | 0.0422 | 2.0041 | 2.5546
MF | 0.0033 | 0.0035 | 0.0034 | 0.4536 | 2.5634
WMF | 0.0533 | 0.0583 | 0.0669 | 70.6555 | 12.4469
NeuMF | 0.0009 | 0.0011 | 0.0014 | 46.3940 | 19.4710
VAECF | 0.0401 | 0.0427 | 0.0469 | 6.0933 | 3.8909
CVAECF | 0.0601 | 0.0661 | 0.0770 | 91.9570 | 5.7691
BiVAECF | 0.0005 | 0.0005 | 0.0005 | 103.3335 | 2.5094




