Gene Dgeo_1030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_1030
Symbol
ID	4057990
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008025
Strand	+
Start bp	1100915
End bp	1102210
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	64%
IMG OID	641230047
Product	3-isopropylmalate dehydratase large subunit
Protein accession	YP_604498
Protein GI	94985134
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR01343] homoaconitate hydratase family protein [TIGR02086] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000620705
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGGAATGA CGATTGCGGA AAAGATTCTG GCGGCCCACA GCGGCCAGAA GGAAGTGGTG 
CCCGGGCAAT TGATCGAGTG CGCGACCGAC TGGGTGCTGT GCCACGAGAT CACCACTCCC 
GCCGCCCTGC GCATGCTTGA AGAACGCGGT ATGGACCGGG TGTTCGATCC GGAAAAGATC 
GTGGCGGTGC CCGATCACTC CGTGCCCGCC ATGAACATCA AGGCGGCCAA GATGTACCAG 
AAGCTCAAGT CCTGGGTGCA GGAAAAGGGG ATCCGGCACT TCTATGACGT GGGCCGCGGC 
GGCATCGCCC ACGTCGTGCT GGAAAATACT GGTCTGATCA AGCCGGGGCA GACGCTCGTC 
AGCGGCGACT CACATACCTG TAACGCCGGT GCGCTCGGCT GCTTTGCCAC GGGCGTGGGC 
AGCACCGACC TCGCGGGGGC GATCTATGCG GGTAAAGTTT GGTTCAAGGT GCCCGAAACC 
ATGCTGATCC GCGTGACGGG TGAGCTGCAG CCCGGCGTGA CGCCTAAGGA TCTGGTGCTC 
GAAGTGATCC GGCGCATCGG CGCAGACGGC GCGAACTACC TGGTGATGGA GTGGGTCGGT 
GACACCATCG AGCGGATGGA CATGGAGGGC CGCTTCACCC TGACGAACAT GGCGATCGAG 
GCGGGGGGCA AGACCGGTAT CGTGGCCGTA GACGACACGA CGCGCGCGTA TATGGCGGCT 
CGTGGCGTCA CCCCCGACCA GTACACCGAG TACACCTCTG ACCCCGACGC ACGGTACAAG 
GTGGTGATTG ACCTCGATGC TTCCAAGGTG GAACCGACGG TCGCCTATCC GCATATCCCC 
AGCAACGGGC GGGTGGCGGG TCAGGACCGT ATTCCCATCA CCCACGCCTA CGTCGGCAGT 
TGCACCAATG GGCGCATCGG TGACCTGCGC GACGTGGCCC GCATCCTCAA GGGCCGCCGG 
GTGGCGGACG GCGTGCAGAT GATTGTGGTG CCCGCGACCC AGGCGATCTG GAAGCAGGCT 
GCGCAGGAAG GGCTGCTGGA AATCTTCGTG GAGGCGGGCG CGAGCGTGAG TTATCCCAGT 
TGCGGCGCCT GTCTGGGCAT GCACTCGGGC GTGTTGGGAC CGGGCGACGT GTGCATTTCC 
AGCTCCAACC GCAACTTCGT GGGCCGCATG GGCGACCCCA GCGCGCAGAT TTACCTCGCT 
TCTCCCGCCA CCGTGGCGGC GAGTGCTGTG GCCGGGTACA TCAGCGACCC GCGCGAGTAC 
AACCCGCAAG GGCAAGGAAC AGAAGCCGCG GATTGA

Protein sequence

MGMTIAEKIL AAHSGQKEVV PGQLIECATD WVLCHEITTP AALRMLEERG MDRVFDPEKI 
VAVPDHSVPA MNIKAAKMYQ KLKSWVQEKG IRHFYDVGRG GIAHVVLENT GLIKPGQTLV 
SGDSHTCNAG ALGCFATGVG STDLAGAIYA GKVWFKVPET MLIRVTGELQ PGVTPKDLVL 
EVIRRIGADG ANYLVMEWVG DTIERMDMEG RFTLTNMAIE AGGKTGIVAV DDTTRAYMAA 
RGVTPDQYTE YTSDPDARYK VVIDLDASKV EPTVAYPHIP SNGRVAGQDR IPITHAYVGS 
CTNGRIGDLR DVARILKGRR VADGVQMIVV PATQAIWKQA AQEGLLEIFV EAGASVSYPS 
CGACLGMHSG VLGPGDVCIS SSNRNFVGRM GDPSAQIYLA SPATVAASAV AGYISDPREY 
NPQGQGTEAA D