Gene Dred_1149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dred_1149
Symbol
ID	4955584
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum reducens MI-1
Kingdom	Bacteria
Replicon accession	NC_009253
Strand	+
Start bp	1219928
End bp	1220944
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	43%
IMG OID	640180318
Product	3-deoxy-7-phosphoheptulonate synthase
Protein accession	YP_001112508
Protein GI	134299012
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2876] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR01361] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00126499
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTGTTG TAATGAGCCA GAGAGCTACA GAAGATCATA TAAATGCTGT TTTAAAAAGA 
CTTCAAAAAG TCGGTTTTGA AATTCATCTA TCTCAAGGGG TTGAAAGAAC CATTATAGGT 
GCTATCGGTG ATAAGACAAG AATGGCTGAT TTGGCACTGG AAGCTATGCC AGAAGTTGAT 
AATGTAGTAC CGATACTTCA GCCCTATAAG CTTGCCAGCA GAACCTTTAA AGAAGAAAAC 
ACCATCATTC GGGTGGGTGA TTTAGAAATC GGCGGTAATC AAATTCATGT GATGGCTGGG 
CCCTGTGCAG TAGAGAGTAG GGAACAGCTT TTTGAGGCCG CGGATGCTGT GAAAAAAGCC 
GGAGCGACGC TGCTTAGGGG AGGTGCCTTT AAACCCCGCA CCTCACCCTA TTCCTTTCAA 
GGATTAGAAG AAAAAGGATT ACAATATTTA GCCGAGGCGA GGGAAAGAAC TGGGCTTAAA 
ATTGTTACAG AGCTTATGGA TGCCAGCAGT TTGCCAATGG TGGCTGAATA TGCAGATATT 
ATACAGATAG GCACCCGAAA CATGCAAAAC TTCTTTCTTT TGCGTGCAGT AGCAAATGTA 
CAAAAACCTG TACTATTGAA AAGAGGTATT TCAGCCACCA TTGAGGAGTG GTTAATGTCT 
GCGGAGTATA TTATGGCCGG GGGAAACTAT CAAGTAATTC TGTGTGAAAG AGGTATCAGA 
TCTTACGAGA GCTATACTCG CAACACCTTG GATTTATCTG CTATACCAGT AATAAAGCAT 
TTATCTCACC TACCGATTAT TGTGGACCCA AGTCACGCGC TGGGAAAATG GAGATTTGTG 
TCTTCCATGT CCAAAGCTGC TGTGGCTGCA GGGGCTGATG GATTATTAAT TGAAGTTCAC 
CCTAATCCCT CAGAGGCCTT GTGTGATGGG CCACAATCCT TAACACCGAA TAACTTCGGT 
TCCTTAATGA CAGAAGTGCA ACAGGTAGCC GGAGCAGTTG GCAGAACATT GACTTAA

Protein sequence

MIVVMSQRAT EDHINAVLKR LQKVGFEIHL SQGVERTIIG AIGDKTRMAD LALEAMPEVD 
NVVPILQPYK LASRTFKEEN TIIRVGDLEI GGNQIHVMAG PCAVESREQL FEAADAVKKA 
GATLLRGGAF KPRTSPYSFQ GLEEKGLQYL AEARERTGLK IVTELMDASS LPMVAEYADI 
IQIGTRNMQN FFLLRAVANV QKPVLLKRGI SATIEEWLMS AEYIMAGGNY QVILCERGIR 
SYESYTRNTL DLSAIPVIKH LSHLPIIVDP SHALGKWRFV SSMSKAAVAA GADGLLIEVH 
PNPSEALCDG PQSLTPNNFG SLMTEVQQVA GAVGRTLT