Gene Dgeo_0599 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_0599
Symbol
ID	4058049
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008025
Strand	-
Start bp	639140
End bp	640690
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	66%
IMG OID	641229613
Product	2-isopropylmalate synthase
Protein accession	YP_604070
Protein GI	94984706
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR00973] 2-isopropylmalate synthase, bacterial type

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.541423
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTCAGC CCCAAGCCCA GGCCCAGCGC ATCCGCATCT TCGACACCAC CCTGCGTGAC 
GGCGAGCAGT CGCCGGGTGT GGCCCTGAAT CACACCCAAA AGCTGGAGAT CGCGCACCAG 
CTCGCTCGGC TGGGCGTCGA CGTGATCGAG GCGGGCTTTC CCATCGCCTC TCCCGGCGAC 
CTGGAAGGCG TCTCGCGCAT CGCCCGCGAG GTCCGCGGCC CCATCATCGC TGGGCTGGCT 
CGCGCGGGCC GCGCCGACAT CGAGGCGGCA GCCAGGGCGG TTGAGCTGGC GGAAAAGCCC 
CGCATCCACA CCTTCATCGC CACCAGCCCC ATTCACATGG CCAAGAAACT GCAACTCGAA 
CCGGACGCGG TGATCGAGCG AGCAGTGGAG GCGGTGCGGC TGGCACGGTC CTTTGTGGAC 
GACGTGGAAT TCAGCGCAGA GGACGCCACC CGCAGCGACC GTGACTTCCT GGTGCGCATT 
TTCCGCGCTG CGGTGGAGGC GGGTGCGACC ACAATCAACG TGCCCGATAC GGTGGGCTAC 
ACCACACCGG AAGAGATCCG CGACCTGTTC GCCTACCTGC GCGGCGAGCT GCCGGACCAC 
ATTATTCTCT CGGCCCACTG TCACGATGAC CTGGGGATGG CTGTGGCCAA CTCCATCGCC 
GCGGCGGAAG GCGGCGCGCG ACAGATTGAG TGCACTGTCA ACGGCATTGG CGAGCGCGCT 
GGGAATGCCA GCCTGGAAGA GATTGTGATG GCCTTTCACA CCCGCCGTGA TCACTACGGC 
TTCGAGACGG GCATCCGCAC CCGCGAGATC TACCGCACCA GCCGCATGGT GAGTCGCCTG 
AGCGGGATGC CCGTCCAGCC CAACAAGGCT GTGGTGGGCG ACAATGCCTT TGCGCACGAG 
TCGGGCATCC ACCAGGACGG CGTCATCAAG GCGCGCGAGA CCTACGAGAT CATGAACGCC 
GAGCTGGTGG GGCGTGAGGC TGCCGTGCTG GTGATGGGCA AGCACTCGGG CCGTGCCGCC 
TTCCGCAAGG CGCTGACGGA TTTGGGCTAC GCGGTGGACG AGGAACGCCT CAAGCAGCTG 
TTTGCCCGCT TCAAGGACAT GGCCGACCGC AAGGGACAGA TCTACGCAGA CGACCTGCGC 
GCCCTGGTGG AAAGCCGCAG CGACGTGCCG CAGACCTTTA CGCTCGAGGG CTTCCAGATC 
ACCTCCGGCA TGAACATGAC ACCGGTCGCC TTTGTGCGTC TGCAGACGCC CGACGGCCCG 
GTGGATGCGA CCGCACACGG CGACGGCCCG GTGGAGGCCG CTTTTCAGGC GATCAACAAA 
ATCACCGGCA TCACGCCCAC GCTGGAGAGC TACCGCATCC AGGCCGTCAC GGGCGGCGGC 
GACGCGCTGG GCGAGGTCAG CATCGGCGCG CGCTACGGCG AGACGACCCT GCACGGAACC 
GGCGTGGCGA CCGATGTGGT TGAAGCTTCT GCCCGCGCCT GGATTCGCAT CGTGAATCAG 
GTGGTGGCGG GCATGGGCAA GAGCCGGGCG GTGAGTCAGA CAACAGTGTG A

Protein sequence

MTQPQAQAQR IRIFDTTLRD GEQSPGVALN HTQKLEIAHQ LARLGVDVIE AGFPIASPGD 
LEGVSRIARE VRGPIIAGLA RAGRADIEAA ARAVELAEKP RIHTFIATSP IHMAKKLQLE 
PDAVIERAVE AVRLARSFVD DVEFSAEDAT RSDRDFLVRI FRAAVEAGAT TINVPDTVGY 
TTPEEIRDLF AYLRGELPDH IILSAHCHDD LGMAVANSIA AAEGGARQIE CTVNGIGERA 
GNASLEEIVM AFHTRRDHYG FETGIRTREI YRTSRMVSRL SGMPVQPNKA VVGDNAFAHE 
SGIHQDGVIK ARETYEIMNA ELVGREAAVL VMGKHSGRAA FRKALTDLGY AVDEERLKQL 
FARFKDMADR KGQIYADDLR ALVESRSDVP QTFTLEGFQI TSGMNMTPVA FVRLQTPDGP 
VDATAHGDGP VEAAFQAINK ITGITPTLES YRIQAVTGGG DALGEVSIGA RYGETTLHGT 
GVATDVVEAS ARAWIRIVNQ VVAGMGKSRA VSQTTV