Tornar al blog
Classificació i Metodologia

Com Netejar Datasets Cripto Abans de Declarar: Guia d'Enginyeria de Dades Fiscal 2025

Guia professional per netejar, depurar i preparar les teves dades de criptomonedes abans de la declaració fiscal. Aprèn tècniques d'enginyeria de dades aplicades a la fiscalitat cripto per obtenir informes precisos davant l'AEAT.

E

Equip Cleriontax

Experts en Fiscalitat Crypto i Anàlisi de Dades

10 min de lectura
Enginyeria de DadesNeteja de DadesNeteja de DadesCSVNormalitzacióDuplicatsFIFOAEATDeclaració RendaModel 100ETLDatasetsConsolidacióTraçabilitat
Cómo limpiar datasets de criptomonedas antes de declarar - Guía de ingeniería de datos fiscal para preparar CSV y calcular correctamente FIFO ante la AEAT
7 de diciembre de 2025
10 min de lectura
Clasificación y Metodología
Enginyeria de DadesNeteja de DadesNeteja de DadesCSVNormalitzacióDuplicatsFIFOAEATDeclaració RendaModel 100ETLDatasetsConsolidacióTraçabilitat

La diferència entre una declaració fiscal de criptomonedes correcta i una que generi problemes amb Hisenda no rau únicament a conèixer la normativa. A la pràctica, el veritable repte està en la qualitat de les dades que utilitzes per calcular les teves guanys i pèrdues patrimonials. Després d'exportar el teu historial de diferents exchanges i wallets, et trobes amb un conjunt d'arxius CSV que, en el seu estat original, contenen inconsistències, duplicats, camps buits i formats incompatibles que faran impossible calcular correctament el mètode FIFO obligatori a Espanya.

A Cleriontax apliquem metodologies d'enginyeria de dades a cada informe fiscal que preparem, perquè sabem que un dataset brut produeix resultats erronis independentment de com sigui de bona l'eina de càlcul. Aquest article t'ensenyarà a preparar les teves dades com ho fem nosaltres, aplicant tècniques professionals de neteja i normalització que garanteixen la precisió de la teva declaració davant l'AEAT.

Per què la neteja de dades és crítica per a la teva declaració fiscal

Quan exportes l'historial d'operacions des de Binance, Coinbase, Kraken o qualsevol exchange, obtens arxius CSV que han estat dissenyats per a ús intern de cada plataforma, no per al compliment fiscal. Cada exchange utilitza el seu propi format, les seves pròpies denominacions per als tipus d'operació i els seus propis criteris per registrar les transaccions. Si, a més, tens activitat en wallets com Metamask i has exportat dades des d'exploradors de blockchain, l'heterogeneïtat de formats es multiplica exponencialment.

El problema fonamental és que l'AEAT requereix dades precises, ordenades cronològicament i expressades en euros per aplicar el mètode FIFO correctament. Un sol duplicat en les teves dades pot distorsionar completament el cost d'adquisició de les teves criptomonedes, generant guanys o pèrdues patrimonials incorrectes.

Errors més freqüents en datasets sense processar

Tipus d'errorConseqüència fiscalFreqüència
Transaccions duplicadesDoble comptabilització, FIFO incorrecteMolt alta
Dates en formats incompatiblesAny fiscal erroni, ordenació incorrectaAlta
Operacions internes mal classificadesGuanys patrimonials ficticisAlta
Valors sense convertir a EURCàlculs en monedes mixtesMitjana
Camps buits o nulsErrors en fórmules i càlculsMitjana
Nomenclatures diferents per al mateix concepteClassificació fiscal incorrectaAlta

Cadascun d'aquests problemes, si no es corregeix abans de calcular les guanys patrimonials, pot derivar en una declaració incorrecta amb les consegüents sancions de l'Agència Tributària.

Fase 1: Inventari i auditoria inicial de fonts de dades

Abans de modificar qualsevol arxiu, és imprescindible fer un inventari complet de totes les fonts de dades que necessites consolidar. Aquesta fase d'auditoria inicial determina l'abast del treball de neteja i permet identificar possibles gaps d'informació.

Comença creant una llista exhaustiva de tots els exchanges on has operat durant l'any fiscal, incloent-hi plataformes que hagis deixat d'utilitzar però on hagis realitzat operacions en el període a declarar. Per a cada exchange, identifica quins tipus d'exportació has realitzat seguint les guies específiques de cada plataforma. Si no has completat l'exportació d'algun exchange, et recomanem consultar la nostra guia per exportar l'historial de Binance correctament com a referència metodològica.

Checklist d'inventari de fonts

Exchanges centralitzats:

  • Identificar totes les plataformes utilitzades (actives i inactives)
  • Verificar que s'han exportat tots els tipus d'historial (trades, staking, earn, conversions)
  • Documentar el rang de dates de cada exportació
  • Anotar el format de cada arxiu (CSV, XLSX, JSON)

Wallets no custodials:

  • Llistar totes les adreces de wallet utilitzades
  • Identificar les xarxes blockchain on cada wallet té activitat
  • Verificar exportacions d'Etherscan, Polygonscan, etc.
  • Incloure tant transaccions com transferències de tokens

Estructura de carpetes recomanada:

📁 Dades_Fiscals_2024/
├── 📁 01_Originals_Intactes/
│   ├── 📁 Binance/
│   ├── 📁 Coinbase/
│   ├── 📁 Metamask_ETH/
│   └── 📁 Metamask_Polygon/
├── 📁 02_En_Procés/
└── 📁 03_Consolidat_Final/

Mantenir sempre una còpia intacta dels arxius exportats abans de realitzar qualsevol modificació és fonamental tant per a auditories internes com per a possibles requeriments de l'AEAT on hagis de demostrar la traçabilitat dels teus càlculs.

Fase 2: Normalització de formats de data i hora

Els formats de data representen un dels problemes més freqüents i potencialment greus en datasets de criptomonedes. Cada exchange utilitza el seu propi format, i les diferències poden semblar subtils però tenen conseqüències significatives per al càlcul fiscal.

Formats de data per plataforma

PlataformaFormat originalExempleZona horària
BinanceYYYY-MM-DD HH:MM:SS2024-06-15 14:32:18UTC
CoinbaseISO 86012024-06-15T14:32:18ZUTC
KrakenUnix timestamp1718458338UTC
EtherscanUnix timestamp1718458338UTC
BitstampDD/MM/YYYY HH:MM15/06/2024 14:32CET

Quan aquests arxius es combinen sense normalització, una ordenació cronològica pot produir resultats completament incorrectes perquè el programari interpreta els camps de manera diferent.

Protocol de normalització de dates

El procés ha de seguir aquests passos en ordre estricte:

  1. Identificar el format de cada arxiu font i documentar-lo explícitament
  2. Convertir tots els formats a ISO 8601 (YYYY-MM-DDTHH:MM:SS) per la seva ordenabilitat natural
  3. Ajustar la zona horària a Espanya (CET/CEST segons la data)
  4. Verificar la conversió comparant dates conegudes amb el registre original

Exemple crític de zona horària:

Una transacció a Etherscan: 2024-12-31 23:30:00 UTC

Convertida a Espanya (horari d'hivern): 2025-01-01 00:30:00 CET

Any fiscal: 2025, no 2024

Aquesta diferència determina en quin exercici fiscal s'ha de declarar l'operació, cosa que pot tenir implicacions significatives si es tracta d'una guanyança o pèrdua patrimonial rellevant.

Fase 3: Detecció i eliminació de duplicats

La duplicació de transaccions és l'error més comú i un dels més perjudicials en datasets de criptomonedes. Es produeix principalment per exportacions amb rangs de dates solapats i operacions que apareixen registrades de múltiples formes en diferents tipus d'exportació del mateix exchange.

Per detectar duplicats correctament, no n'hi ha prou amb comparar files idèntiques. Has d'implementar una lògica d'identificació basada en camps clau que defineixin la unicitat de cada transacció.

Camps clau per identificar duplicats

En exchanges centralitzats:

  • Data i hora exacta (fins a segons)
  • Parell de trading (BTC/EUR, ETH/USDT...)
  • Tipus d'operació (buy, sell, trade)
  • Quantitat executada
  • Preu d'execució

En transaccions blockchain:

  • Hash de transacció (txHash) → identificador únic definitiu
  • Si no hi ha hash: combinació de bloc + from + to + value

Procés de deduplicació en tres passades

PassadaCriteriAcció
PrimeraFiles 100% idèntiquesEliminar automàticament
SegonaCamps clau coincideixen, columnes secundàries difereixenEliminar conservant la informació més completa
TerceraTransaccions similars no idèntiquesRevisió manual cas per cas

Exemple de duplicat subtil:

Fila 1: 2024-06-15 14:32:18 | BTC/EUR | BUY | 0.05 | 62450.00 | fee: 0.0001
Fila 2: 2024-06-15 14:32:18 | BTC/EUR | BUY | 0.05 | 62450.00 | fee: (buit)

Ambdues representen la mateixa operació, però una té la comissió i l'altra no. La passada 2 ha de conservar la fila 1.

Mantén un registre de tots els duplicats eliminats. Aquest registre serveix com a documentació del procés de neteja i permet verificar que no s'han eliminat operacions legítimes per error. Si treballes amb eines d'anàlisi com les que descrivim a la nostra guia d'eines per rastrejar criptomonedes, moltes inclouen funcions de detecció de duplicats que pots utilitzar com a verificació creuada.

Fase 4: Classificació i estandardització de tipus d'operació

Cada exchange utilitza la seva pròpia terminologia per descriure els tipus d'operació. El que Binance anomena "SPOT Trade" pot aparèixer com a "Trade" a Coinbase, "Exchange" a Kraken o simplement "Buy" en altres plataformes. Per aplicar correctament el tractament fiscal a cada operació, necessites un sistema de classificació estandarditzat.

Taula de mapping: denominacions originals → categoria fiscal

Denominació originalExchangeCategoria fiscal estandarditzada
SPOT Trade, Trade, ExchangeDiversosPermuta / Guany patrimonial
Buy, Purchase, CompraDiversosAdquisició
Sell, VentaDiversosEnajenació / Guany patrimonial
Convert, Conversion, SwapDiversosPermuta / Guany patrimonial
Deposit, IngresoDiversosMoviment intern (verificar origen)
Withdrawal, RetiroDiversosMoviment intern (verificar destinació)
Staking Reward, InterestDiversosRendiment del capital mobiliari
Airdrop, DistributionDiversosRendiment del capital (valorar a mercat)
Fee, Commission, GasDiversosDespesa deduïble

Categories fiscals principals

La correcta classificació de cada operació en determina el tractament fiscal:

  • Guanys/pèrdues patrimonials: Vendes, permutes entre criptos, pagaments amb cripto
  • Rendiments del capital mobiliari: Staking, lending, farming, airdrops
  • Moviments interns: Transferències entre wallets pròpies (no tributen)
  • Despeses deduïbles: Comissions, gas fees, trading fees

Un error freqüent és classificar transferències entre wallets pròpies com a vendes, cosa que genera guanys patrimonials ficticis. Per aprofundir en els criteris de classificació segons l'AEAT, et recomanem consultar el nostre article sobre com classificar operacions de criptomonedes.

Fase 5: Conversió de valors a euros

L'AEAT requereix que totes les operacions es declarin en euros, valorades al tipus de canvi del moment exacte de cada transacció. Aquest requisit implica un procés de conversió que s'ha de realitzar amb precisió i amb fonts de cotització documentades.

Fonts de cotització recomanades

Tipus d'actiuFont primàriaFont alternativaGranularitat
BTC, ETH, top 20CoinGecko APICoinMarketCapMinuts
Altcoins líquidesCoinGecko APIExchange on s'ha operatHores
Tokens il·líquidsPreu a l'exchangeDEX (Uniswap, etc.)Transacció
Stablecoins USDTipus de canvi EUR/USDBCE o OANDADiari

Procés de conversió per a operacions cripto-cripto

Per a operacions realitzades en parells cripto-cripto, necessites una conversió en dues passes:

Exemple: Swap ETH → LINK a Uniswap

1. Operació original:
   - Enviat: 2 ETH
   - Rebut: 150 LINK
   - Data: 2024-07-20 15:45:00 UTC

2. Pas 1 - Valorar ETH en EUR:
   - Preu ETH el 20/07/2024 15:45: 3.200 €
   - Valor enviat: 2 × 3.200 = 6.400 €

3. Pas 2 - Valorar LINK en EUR:
   - Preu LINK el 20/07/2024 15:45: 42,50 €
   - Valor rebut: 150 × 42,50 = 6.375 €

4. Resultat fiscal:
   - Valor de transmissió: 6.375 € (el que reps)
   - Si el cost d'adquisició dels ETH era 5.000 €:
   - Guany patrimonial: 6.375 - 5.000 = 1.375 €

El procés ha de documentar la font de cada cotització utilitzada. Això és especialment important per a operacions d'alt valor on una diferència de cotització pot suposar milers d'euros de diferència en la guanyança patrimonial calculada.

A Cleriontax utilitzem bases de dades pròpies de cotitzacions històriques validades que ens permeten aplicar conversions precises fins i tot per a tokens poc líquids.

Fase 6: Tractament de camps buits i valors anòmals

Els camps buits i els valors anòmals en datasets de criptomonedes poden tenir múltiples causes legítimes, però també poden indicar problemes d'exportació que requereixen correcció. El tractament d'aquests casos ha de ser acurat per no eliminar informació vàlida ni propagar errors.

Interpretació de camps buits

Camp buitInterpretació probableAcció
Fee / ComissióPromoció sense fee o fee en un altre tokenVerificar, si és correcte → 0
PreuError greu d'exportacióConsultar l'historial original
QuantitatError greu d'exportacióConsultar l'historial original
Hash de transaccióNormal en exchanges centralitzatsAcceptable
Notes / MemoCamp opcional no utilitzatIgnorar

Detecció de valors anòmals

Implementa validacions automàtiques que marquin valors sospitosos:

  • Preu implícit ±20% vs mercat: Flag per a revisió manual
  • Quantitats negatives: Error de signe, corregir
  • Dates fora de rang: Exportació corrupta, tornar a exportar
  • Fees superiors al 10% del valor: Verificar (pot ser legítim en xarxes congestionades)

Exemple d'anomalia legítima:

Operació: Swap 0.01 ETH → 50 USDC
Data: 2024-05-15 (congestió de xarxa per memecoin)
Gas fee: 0.008 ETH (80% del valor operat)

→ Sembla anòmal però és correcte. Documentar i conservar.

Cada anomalia s'ha d'investigar individualment per determinar si representa un error que cal corregir o una operació atípica però legítima.

Fase 7: Consolidació de múltiples fonts

Un cop cada arxiu font s'ha normalitzat individualment, el pas següent és consolidar totes les dades en un dataset únic que representi la totalitat de la teva activitat en criptomonedes durant el període fiscal.

Esquema de columnes unificat

ColumnaTipusObligatòriaDescripció
fecha_horadatetimeISO 8601, zona horària Espanya
tipo_operacionstringCategoria fiscal estandarditzada
cripto_enviadastringSegons tipusSímbol de l'actiu venut/enviat
cantidad_enviadadecimalSegons tipusQuantitat de l'actiu enviat
cripto_recibidastringSegons tipusSímbol de l'actiu comprat/rebut
cantidad_recibidadecimalSegons tipusQuantitat de l'actiu rebut
valor_eurdecimalValor de l'operació en EUR
fee_eurdecimalComissió total en EUR
fuentestringExchange/wallet d'origen
hash_txstringNoHash de blockchain si aplica
notasstringNoObservacions del procés

Procés de consolidació

  1. Afegir una columna d'origen a cada registre abans de combinar
  2. Unificar noms de columnes segons l'esquema estàndard
  3. Combinar tots els arxius en un únic dataset
  4. Ordenar cronològicament per fecha_hora
  5. Executar una deduplicació final per si hi ha operacions creuades

Si la consolidació i el càlcul FIFO et resulten complexos, el nostre servei d'anàlisi de carteres inclou tot el procés de neteja, normalització i càlcul amb verificació professional de cada pas.

Fase 8: Validació creuada i verificació d'integritat

Abans d'utilitzar el dataset net per calcular la teva declaració fiscal, és imprescindible realitzar una validació creuada que verifiqui la integritat de les dades processades.

Tres verificacions obligatòries

1. Balanç de control

Calcula el saldo final de cada criptomoneda segons el teu dataset i compara'l amb el saldo real:

Saldo segons dataset BTC: 0.5423 BTC
Saldo real en exchanges + wallets: 0.5420 BTC
Diferència: 0.0003 BTC (0.05%)

→ Diferència acceptable per arrodoniments

Diferències superiors a l'1% requereixen investigació.

2. Recompte d'operacions

Registres originals totals: 2.847
Duplicats eliminats (documentats): 156
Registres en el dataset final: 2.691

2.847 - 156 = 2.691 ✓ Quadra

3. Coherència temporal

Revisa que no existeixin gaps temporals inexplicats. Si has operat activament tot l'any però el teu dataset mostra mesos sense activitat, pot indicar exportacions incompletes.

Aquesta fase de validació és on un servei professional de liquidacions fiscals aporta més valor, ja que l'experiència permet identificar patrons d'error que un usuari ocasional podria passar per alt.

Eines per automatitzar la neteja

Per a usuaris amb volums elevats de transaccions, el processament manual pot resultar impracticable. Aquestes eines ajuden a automatitzar part del procés:

Comparativa d'eines

EinaVolum recomanatNivell tècnicCost
Excel / Google Sheets< 2.000 txBàsicGratuït
Google Sheets + QUERY< 5.000 txIntermediGratuït
Python + pandasIl·limitatAvançatGratuït
Koinly / CoinTracking< 10.000 txBàsicDe pagament

Per a Excel/Sheets:

  • Funció ELIMINAR.DUPLICADOS per a la passada 1
  • Taules dinàmiques per a la verificació de totals
  • BUSCARV / VLOOKUP per afegir cotitzacions
  • Format condicional per detectar anomalies

Per a usuaris tècnics (Python):

import pandas as pd

# Carregar i combinar fonts
df = pd.concat([binance_df, coinbase_df, etherscan_df])

# Normalitzar dates
df['fecha'] = pd.to_datetime(df['fecha'], utc=True)
df['fecha'] = df['fecha'].dt.tz_convert('Europe/Madrid')

# Eliminar duplicats per camps clau
df = df.drop_duplicates(subset=['fecha', 'par', 'tipo', 'cantidad'])

# Ordenar cronològicament
df = df.sort_values('fecha')

Les eines de fiscalitat cripto com Koinly inclouen funcions de neteja integrades, però apliquen els seus propis criteris que poden no coincidir exactament amb els requisits de l'AEAT. Recomanem utilitzar-les com a complement per a la verificació creuada.

Documentació del procés de neteja

Cada decisió presa durant el procés de neteja ha de quedar documentada. Aquesta documentació serveix per reproduir el procés si necessites recalcular, proporciona evidència davant possibles requeriments de l'AEAT i facilita la revisió per tercers.

Contingut del document de metodologia

  • Inventari complet de fonts amb dates d'exportació
  • Criteris de normalització aplicats a cada tipus de camp
  • Taula de mapping de tipus d'operació
  • Fonts de cotització utilitzades per a la conversió a EUR
  • Registre de duplicats eliminats amb justificació
  • Anomalies detectades i el seu tractament
  • Resultats de les verificacions d'integritat

Conserva també tots els arxius intermedis del procés, no només els originals i el resultat final. Si posteriorment detectes un error, els arxius intermedis permeten identificar en quina fase es va introduir.

En els nostres serveis de seguiment de cartera, incloem documentació completa del procés d'anàlisi que lliurem juntament amb l'informe fiscal, garantint una traçabilitat total.

Errors crítics que has d'evitar

Hi ha errors en el procés de neteja amb conseqüències especialment greus:

1. Eliminar operacions legítimes com a "duplicats"

En trading actiu és freqüent executar múltiples operacions del mateix parell en intervals curts. Verifica que les transaccions siguin veritablement idèntiques abans d'eliminar-les.

2. Conversió de moneda incorrecta

Dividir quan havies de multiplicar, o utilitzar el tipus de canvi invers, genera valors absurds que poden passar desapercebuts sense verificacions de balanç.

3. Ignorar les comissions

Les fees són despeses deduïbles que redueixen la teva guanyança patrimonial. Un dataset on les comissions s'han perdut produeix una declaració que paga més impostos dels deguts.

4. Classificar moviments interns com a vendes

Els moviments entre els teus propis exchanges i wallets no generen tributació. Si es classifiquen com a vendes, produeixen guanys patrimonials ficticis que no hauries de pagar.

Si no tens seguretat en algun aspecte del procés, el nostre equip d'assessoria fiscal especialitzada en criptomonedes pot revisar la teva feina i detectar problemes abans que afectin la teva declaració.

Conclusió: dades netes, declaració correcta

La neteja de datasets de criptomonedes no és un pas opcional ni una millora cosmètica. És un requisit fonamental per obtenir una declaració fiscal precisa que compleixi amb els requisits de l'AEAT i que puguis defensar davant un possible requeriment. Un dataset brut produirà resultats incorrectes independentment de la qualitat del programari o la metodologia de càlcul que utilitzis posteriorment.

El procés complet requereix temps, atenció al detall i coneixement tant de l'operativa de criptomonedes com dels requisits fiscals espanyols. Per a usuaris amb operativa simple i poques transaccions, seguir aquesta guia hauria de ser suficient. Per a operatives complexes amb múltiples exchanges, activitat DeFi significativa o milers de transaccions, l'assistència professional pot estalviar temps i evitar errors costosos.

A Cleriontax combinem experiència en fiscalitat de criptomonedes amb metodologies rigoroses d'enginyeria de dades per garantir que cada informe que preparem es basa en dades verificades i traçables. Si prefereixes delegar aquest procés tècnic, els nostres serveis especialitzats estan dissenyats exactament per a això.

El teu pròxim pas: Si ja has exportat les teves dades i necessites ajuda amb la neteja, la consolidació o el càlcul fiscal, contacta amb el nostre equip per a una avaluació inicial sense compromís. Si encara estàs en fase d'exportació, visita el nostre blog on trobaràs guies específiques per a cada exchange i wallet.

Avís legal: Aquest article té finalitat informativa i educativa. No constitueix assessorament fiscal personalitzat. La normativa fiscal està subjecta a canvis i cada situació personal és única. Consulta sempre amb un assessor fiscal professional abans de prendre decisions fiscals.

Última actualització: Desembre 2025

Publicat per: Equip Cleriontax - Experts en Fiscalitat Cripto i Anàlisi de Dades

T'ha estat útil aquest article?

Comparteix-lo amb altres inversors que ho puguin necessitar

Articles relacionats

Continua aprenent sobre fiscalitat de criptomonedes

LP Tokens y Liquidity Pools - Guía fiscal completa sobre cómo tributan los pools de liquidez y los tokens LP ante la AEAT en España
DeFi i Protocols Avançats
Destacat
15 min

LP Tokens al Descobert: Com Tributen els Pools de Liquiditat a Espanya

Dipositar en un pool de liquiditat genera més obligacions fiscals de les que imagines: permutes en entrar, rendiments mentre romanes, i noves plusvàlues en sortir. Descobreix el cicle fiscal complet dels LP tokens i evita errors que et poden costar milers d'euros davant l'AEAT.

Liquidity PoolsLP TokensFiscalitat DeFi Avançada+13
E

Equip Cleriontax

Experts en Fiscalitat Crypto i Anàlisi de Dades

Llegir més
Yield Farming y fiscalidad en España - Guía completa sobre cómo tributan los rendimientos de farming DeFi ante la AEAT
DeFi i Protocols Avançats
Destacat
14 min

Yield Farming a Espanya: Guia Fiscal Completa sobre Com Tributen els Rendiments DeFi

El yield farming genera rendiments atractius, però la seva tributació a Espanya és complexa: rewards, tokens LP, impermanent loss i múltiples protocols. Descobreix exactament com declarar cada tipus de guany davant l’AEAT i evita sancions que poden superar el 150%.

Yield FarmingFiscalitat DeFi AvançadaFarmeo Criptomonedes+12
E

Equip Cleriontax

Experts en Fiscalitat Crypto i Anàlisi de Dades

Llegir més

Necessites ajuda amb la teva declaració de criptomonedes?

El nostre equip d'experts pot analitzar el teu cas i preparar la teva declaració fiscal completa

Sol·licitar anàlisi gratuïta