Gene Daro_4020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_4020
Symbol
ID	3567192
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	4318295
End bp	4319959
Gene Length	1665 bp
Protein Length	554 aa
Translation table	11
GC content	65%
IMG OID	637682493
Product	alpha subunit of malonate decarboxylase
Protein accession	YP_287217
Protein GI	71909630
COG category	[I] Lipid transport and metabolism
COG ID	[COG4670] Acyl CoA:acetate/3-ketoacid CoA transferase
TIGRFAM ID	[TIGR01110] malonate decarboxylase, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	0.0677734
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGCAC CGCAACCCCG TCAATGGGAC AGCCTGCGCC AGAACCGGGC GCGCCGCCTG 
GAACGGGCGG CCAGCCTCGG CCTGGCTGGC CAGAATGGCA AGGAAATTCC GGTCGATCGC 
ATCATCGACC TGCTCGAAGC CGTCATCCAG CCGGGCGACC GTGTCTGCCT CGAGGGCAAC 
AACCAGAAGC AGGCCGATTT CCTGTCCGAG TCGCTGGCCG ATTGCGATCC GGCCCGTATC 
AATCACCTCA GCATGGTCCA GTCTGTCCTG GCGCTTCCGA GCCACGTGGA CCTTTTCGAG 
CGCGGCCTGG CAACCCGCCT CGACTTTTCT TTCAGCGGCC CGCAGGGCGC CCGGCTGGCC 
AAGCTGGTCC AGGAACAGCG CATCGAGATC GGGGCCATCC ATACCTATCT CGAACTGTTC 
GGGCGCTATT TCATGGATCT GACGCCGAAT GTGGCGCTGA TCGCGGCGCA GGCGGCCGAT 
GCCGAGGGCA ACCTCTACCT CGGGCCGAAT ACCGAGGACA CGCCGGCCAT CGTCGAGGCG 
ACCGCGTTCA AGGGCGGCAT CGTGATCGCC CAGGTCAACG AGCGCCTCGA CAAGCTGCCG 
CGCGTCGATG TGCCGGCCGA CTGGGTCGAC TTCACGGTGC TGGCGCCGAA GCCCAACTAC 
ATTGAGCCAC TATTCACCCG CGACCCGGCG CAGATCACCG AAGTCCAGGT GCTGATGGCG 
ATGATGGCGA TCAAGGGCAT CTACGCCGAA TACGGCGTTA CCCGGCTCAA TCACGGCATC 
GGCTTCGATA CCGCGGCGAT CGAGTTGCTG CTGCCGACCT ACGCTGCCGA CCTCGGCCTG 
AAGGGCAAGA TCTGCACGCA CTGGGCGCTC AATCCACATC CGACGCTGAT TCCGGCCATC 
GAAGCCGGTT TCGTCGAGTC GGTCCATTGT TTCGGTTCCG AAGTCGGCAT GGATGACTAC 
ATCTCCGCCC GTTCCGACAT CTTTTTTACC GGTGCCGACG GCAGCATGCG TTCCAACCGG 
GCGTTTTCGC AAACGGCCGG CCTTTACGCC TGCGATATGT TCATCGGCTC GACCTTGCAG 
ATGGACTTGG CCGGCAACAG TTCGACCGCG ACGCTGGGCC GCATCACCGG CTTCGGCGGG 
GCGCCGAACA TGGGGTCCGA TCCGCACGGC CGGCGTCATG CCAGCCCGGC CTGGCTCAAG 
GCCGGGCGTG AGGCCTACGG GCCGCAGGCG ATTCGCGGCC GCAAGCTGGT GGTGCAGATG 
GTCGAGACTT TCCGCGAACA CATGGCGCCG GTTTTCGTCG ACGATCTCGA TGCCTGGAAG 
TTGCAGGCCA GCATGGGTTC CGACCTGCCG CCGATCATGA TCTACGGCGA CGACGTCAGC 
CATATCGTTA CCGAGGAAGG CATCGCCAAC CTGCTGCTCT GCCGCACACC GGCTGAGCGC 
GAGCAGGCGA TCCGCGGTGT GGCCGGCTTC ACGCCGGTCG GGATGGCGCG GGACAAGGGC 
ACCGTCGAAA ACCTGCGCGA TCGCGGCATC ATCCGCCGCC CGGAAGACCT CGGCATCGAC 
CCGCGCCAGG CCAGCCGCGA CCTGTTGGCC GCCCGTTCGA TCAAGGATCT GGTGCGCTGC 
TCCGGTGGCC TGTACGCGCC GCCTTCACGT TTCCGCAACT GGTGA

Protein sequence

MNAPQPRQWD SLRQNRARRL ERAASLGLAG QNGKEIPVDR IIDLLEAVIQ PGDRVCLEGN 
NQKQADFLSE SLADCDPARI NHLSMVQSVL ALPSHVDLFE RGLATRLDFS FSGPQGARLA 
KLVQEQRIEI GAIHTYLELF GRYFMDLTPN VALIAAQAAD AEGNLYLGPN TEDTPAIVEA 
TAFKGGIVIA QVNERLDKLP RVDVPADWVD FTVLAPKPNY IEPLFTRDPA QITEVQVLMA 
MMAIKGIYAE YGVTRLNHGI GFDTAAIELL LPTYAADLGL KGKICTHWAL NPHPTLIPAI 
EAGFVESVHC FGSEVGMDDY ISARSDIFFT GADGSMRSNR AFSQTAGLYA CDMFIGSTLQ 
MDLAGNSSTA TLGRITGFGG APNMGSDPHG RRHASPAWLK AGREAYGPQA IRGRKLVVQM 
VETFREHMAP VFVDDLDAWK LQASMGSDLP PIMIYGDDVS HIVTEEGIAN LLLCRTPAER 
EQAIRGVAGF TPVGMARDKG TVENLRDRGI IRRPEDLGID PRQASRDLLA ARSIKDLVRC 
SGGLYAPPSR FRNW