does not reproduce results w/ previous buffer

2023-12-22 14:26:48 -08:00
parent 2929cfdb44
commit 70fe242adc
2 changed files with 3 additions and 3 deletions
--- a/tdmpc2/common/buffer.py
+++ b/tdmpc2/common/buffer.py
@@ -37,13 +37,13 @@ class Buffer():
 		return ReplayBuffer(
 			storage=storage,
 			sampler=SliceSampler(
-				slice_len=self.cfg.horizon+1,
+				num_slices=self.cfg.batch_size,
 				end_key=None,
 				traj_key='episode',
 				truncated_key=None,
 			),
 			pin_memory=True,
-			prefetch=2,
+			prefetch=1,
 			batch_size=self.cfg.batch_size,
 		)

--- a/tdmpc2/trainer/online_trainer.py
+++ b/tdmpc2/trainer/online_trainer.py
@@ -50,7 +50,7 @@ class OnlineTrainer(Trainer):
 	def to_td(self, obs, action=None, reward=None):
 		"""Creates a TensorDict for a new episode."""
 		if isinstance(obs, dict):
-			obs = TensorDict({k: v.unsqueeze(0) for k,v in obs.items()}, batch_size=(1,)).cpu()
+			obs = TensorDict(obs, batch_size=(), device='cpu')
 		else:
 			obs = obs.unsqueeze(0).cpu()
 		if action is None: