Gene Dgeo_1572 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_1572
Symbol
ID	4057263
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008025
Strand	-
Start bp	1671359
End bp	1672498
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	67%
IMG OID	641230593
Product	bifunctional 3-deoxy-7-phosphoheptulonate synthase/chorismate mutase
Protein accession	YP_605036
Protein GI	94985672
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1605] Chorismate mutase [COG2876] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR01361] phospho-2-dehydro-3-deoxyheptonate aldolase [TIGR01801] chorismate mutase domain of gram positive AroA protein

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.829295
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGACTAGCG GTGTGAGGCC AGAACACGAA GCGCTTTTCT ACACTGGCCG CATGACCCAA 
CGCAGTATCG ACGACCTCCG CGCCGAGGTC GATGCCATCA ACCGTGACCT TCTGACCCTG 
CTCTCGCGCC GTGGCGAGGT GGTCGCGCAG ATCGGCCGGG CCAAAACCCA GGAGGGCCGC 
CCGCAGCACT ACGATCCCGC CCGCGAGGAA CAGCAGCTGC GCGTGCTGGA GCAGCTGAAC 
CCTGGCCCCT TCACGAGCGC CGCCGTCAAG GCCATCTTCA AGGAAATTTT CAAGGCCAGC 
CTGGACCTTG AGGAGAGCAA CGACAAAAAG CAGCTGCTGG TGTCACGTAA GGTCAAACCC 
GAGGACACCC AGCTCGACAT CGACGGCGTC CGCATCGGCG GGGGCGCCCC GCCCGTCGTG 
ATTGCGGGGC CCTGCTCCAT CGAGTCGGAA GAGCAGATGG AGGAGACGGC CCGTTTCCTG 
GCCTCGCGCG GCGTGAAGAT CCTGCGCGGC GGTGCCTACA AACCCCGCAC CAGTCCCTAC 
GGCTTCCAGG GCATGGGCGT GGACGGCTTG ATCATCGGCG GGCGGGCGGC GCGCGAGAAT 
GGCATGCTCT TTGTGACCGA AGTGATGGAC ACCCGCGATG TGGAGGTCGT GGCCGAGCAC 
GCCGACATCC TCCAGGTGGG CGCGCGCAAC ATGCACAACT TCAGCCTGCT CCGTGAAGTG 
GGCCGCGCCC GGCGCCCGGT GCTGCTCAAG CGCGGCCTGA GCGCCACCAT CGAAGAGTGG 
CTCTATGCCG CCGAGTACAT CCTCTCGGAG GGGAACCCCG AAGTGATCCT CTGCGAGCGC 
GGCATTCGCA CCTTTGAGAA GTGGACCCGC AACACCCTCG ACCTCTCGGC GGTGGCTCTT 
GCCAAGCAGG AGACGCACCT CCCGGTCATC GTGGACGTGA CGCACGCCGC CGGACGCCGC 
GACCTGCTGA TCCCGCTTGC CAGAGCCGCC CTTGCCGTCG GCGCCGACGG CATCCACGTC 
GAGGTCCACC CCAGCCCCGC CACCGCCCTG AGCGACAACG AGCAGCAGCT CGACTTCGCG 
GGGTACGACC GCTTCCTCGA CGCGCTGGCG CCACTGCTCA AGGTGGCCGC GACCGTCTGA

Protein sequence

MTSGVRPEHE ALFYTGRMTQ RSIDDLRAEV DAINRDLLTL LSRRGEVVAQ IGRAKTQEGR 
PQHYDPAREE QQLRVLEQLN PGPFTSAAVK AIFKEIFKAS LDLEESNDKK QLLVSRKVKP 
EDTQLDIDGV RIGGGAPPVV IAGPCSIESE EQMEETARFL ASRGVKILRG GAYKPRTSPY 
GFQGMGVDGL IIGGRAAREN GMLFVTEVMD TRDVEVVAEH ADILQVGARN MHNFSLLREV 
GRARRPVLLK RGLSATIEEW LYAAEYILSE GNPEVILCER GIRTFEKWTR NTLDLSAVAL 
AKQETHLPVI VDVTHAAGRR DLLIPLARAA LAVGADGIHV EVHPSPATAL SDNEQQLDFA 
GYDRFLDALA PLLKVAATV