Gene Daro_3775 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3775
Symbol
ID	3567508
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	4059604
End bp	4060680
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	60%
IMG OID	637682250
Product	3-isopropylmalate dehydrogenase
Protein accession	YP_286974
Protein GI	71909387
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID	[TIGR00169] 3-isopropylmalate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	0.00289706
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00333636
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAATCT GTGTAATTCC CGGGGACGGC ATCGGTGTCG AAATTTGTGC CGAGGCCGTC 
AGGGTGATCG ACGCCCTGAA GGATATCCAT GGCCTGAAAA TCGAATATGA GTACGGGCTG 
TTGGGTGGCG CCGCCTACGA TCAGACGGGG CGCCCCTTGC CGGTTGAAAC CTTGAGGCTG 
GCTGACGAAG CCAACGCCAT CCTGCTCGGT GCCGTCGGCG GCCCGAAGTG GGACAAGCTG 
CCGGCCGAGT CGCGCCCCGA ACGCGGCTTG CTGGGGATCA GGAAATATCT CGGGCTCAAT 
GCCAATCTGC GTCCGATCAA GGTCTATCCG GAACTGGCCA ATGCCTCGAC GCTGCGCCCG 
GAGGTGGTCA GCGGACTCGA CATGATGATC GTCCGGGAAC TGACGGGCGA TATCTATTTT 
GGCCAGCCGC GCGGGATACG GACCTCCGGG TTCGAACGCG TCGGTTACAA CACCATGGAG 
TACTCCGAAT CCGAGATCGC ACTGATCGCC GAAATGGCGT TCAGGATTGC CCGCCAACGG 
AGTGGCAAGG TGATGTCCGT CGACAAGATG AATGTGCTGG AGTGCATGCA GCTCTGGCGC 
GACGTGGTGA CCAAGGTCGG CGAACGTTTC CCGGATGTCA CGCTCGATCA CATGCTGGTC 
GACAACGCGG CCATGCAACT GGTCAAGAAC CCGAAGCAGT TTGATGTCCT GCTCACCGGC 
AACATGTTTG GTGACATTCT CTCGGACGAA GCCGCGATGC TGACCGGTTC GATCGGCATG 
CTGCCTTCGG CCTCGCTCAA TGTCGAGGAC AAAGGGATGT ATGAGCCTTG CCATGGTTCA 
GCGCCGGACA TTGCAGGGCA GGGCGTTGCC AATCCCTTGG GCATGATTCT GTCGGCAGCG 
ATGATGTTCC GCTATAGCTT GGGCCGGCCG GACATGGCCG ATGCGATCGA ATCAGCGGTC 
CAGACGGTAT TGACGAATGG CGCGCGGACC AGGGATATTT TCCAGGCCGG TGACCGTTTG 
GTTTCCACTT CCGAAATGGG TGGGCTGGTC GAGGCGGCGC TAAGGCGAAT CAGCTAG

Protein sequence

MKICVIPGDG IGVEICAEAV RVIDALKDIH GLKIEYEYGL LGGAAYDQTG RPLPVETLRL 
ADEANAILLG AVGGPKWDKL PAESRPERGL LGIRKYLGLN ANLRPIKVYP ELANASTLRP 
EVVSGLDMMI VRELTGDIYF GQPRGIRTSG FERVGYNTME YSESEIALIA EMAFRIARQR 
SGKVMSVDKM NVLECMQLWR DVVTKVGERF PDVTLDHMLV DNAAMQLVKN PKQFDVLLTG 
NMFGDILSDE AAMLTGSIGM LPSASLNVED KGMYEPCHGS APDIAGQGVA NPLGMILSAA 
MMFRYSLGRP DMADAIESAV QTVLTNGART RDIFQAGDRL VSTSEMGGLV EAALRRIS