Gene Dgeo_1033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_1033
Symbol
ID	4057993
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008025
Strand	+
Start bp	1104077
End bp	1105132
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	68%
IMG OID	641230050
Product	3-isopropylmalate dehydrogenase
Protein accession	YP_604501
Protein GI	94985137
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID	[TIGR00169] 3-isopropylmalate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.895977
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00144137
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCTAAAG TCGTCACCCT ACCCGGCGAT GGGATCGGCC CCGAAGTCAC CGCTGCCGCC 
GCCGAAGTGC TGCGCGAGGT CGCGCCCGAC GTCCACATTG AGGAACACGC CATCGGTGGC 
GCGGCCTACG AACAGTTCGG GGATCCCTTC CCGCAGCGGA CCCGTGACGC CCTAGGGGAC 
GCGGACGCGG TGCTGCTGGG GACCGTGGGG GGCGCGCAGA ACAGCCCCTG GAACAGCCTT 
CCGCGTCCCT TGCGCCCGGA AAGCGGCCTG CTGGCGCTGC GCCGGGCGCT GGGCTGTTAC 
GCCAACCTGC GGCCCGTGCG GGTGCTGCCG GGTCTGGAAC ACCTCTCGCC GCTCAAGCCC 
GAACTGGCGC GCGGCGTGGA CATCCTGATT GTGCGTGAGC TGCTGGGCGG CATCTACTTC 
GACGGCGACC GCAAGATCGA GGGGGACACG GCTTACAACA CCATGCGCTA CACCACGCCC 
GAGGTCGAGC GCGTGGCAAG GGTGGCCTTT TGGGCCGCCG AGCAGCGCCG GGGTCGCGTG 
ACGAGCGTGG ACAAGGCCAA CGTGCTGGAG GTGTCTGAGC TGTGGCGCCG CGACGTACAG 
GCCCTGCGCG ACCGCGAGTA CCGCAACGTC CACCTCAACC ATGAGTACGT TGATTCGGTC 
GCCATGCTGA TTGTTGCCAA TCCCAGCCGC TACGACGTGA TTCTCACCGA GAACCTCTTC 
GGGGACATTC TCTCCGACCT GGCCGCTGTG ATTCCTGGTT CGCTGGGCTT GATGCCGAGT 
GCCTCGCTGG GCGACGGCCC CGGTCTCTTT GAGCCGATCC ACGGCAGCGC CCCCGACATT 
GCCGGGCAGG GCATCGCCAA CCCCGCCGCC GCGATCATGA GCGTAGCGAT GCTGCTGCGC 
CACGGCCTCG AGCGTCCCCA GGTGGCCAAC CAGGTCGAGC GGGCGGTGGC CTTGGCCCTG 
CGCGAGCATC CCACCCGTGA CCTGGGTGGG CAGGCCGATA CGCGGACCTT CACACACGCT 
GTGCTGGACG CAATGGGGAG CCCGAGTGTG GGATAA

Protein sequence

MPKVVTLPGD GIGPEVTAAA AEVLREVAPD VHIEEHAIGG AAYEQFGDPF PQRTRDALGD 
ADAVLLGTVG GAQNSPWNSL PRPLRPESGL LALRRALGCY ANLRPVRVLP GLEHLSPLKP 
ELARGVDILI VRELLGGIYF DGDRKIEGDT AYNTMRYTTP EVERVARVAF WAAEQRRGRV 
TSVDKANVLE VSELWRRDVQ ALRDREYRNV HLNHEYVDSV AMLIVANPSR YDVILTENLF 
GDILSDLAAV IPGSLGLMPS ASLGDGPGLF EPIHGSAPDI AGQGIANPAA AIMSVAMLLR 
HGLERPQVAN QVERAVALAL REHPTRDLGG QADTRTFTHA VLDAMGSPSV G