Gene Spro_1287 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_1287
Symbol
ID	5604873
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	+
Start bp	1416323
End bp	1417378
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	56%
IMG OID	640936819
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_001477519
Protein GI	157369530
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.300084
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTACC TAAATGACGA TTTACGTATT AAAGAAATTA AGGAACTCCT GCCACCGGTG 
GCCCTGTTAG AAAAGTTTCC GGCCACTGAA CGTGCAGCAG AGACGGTGTC ACAGGCACGC 
AATGCCATTC ATCAGATCCT TCGCGGCAGC GACGATCGCC TGCTGGTGGT GATCGGCCCT 
TGCTCGATCC ACGATACCAA AGCCGCCAAA GAGTACGCCG GTCGCCTGCT GGCGCTGCGT 
CAGGAACTGA GCGGTGAGCT GGAAGTGGTG ATGCGCGTTT ATTTTGAAAA ACCGCGTACT 
ACCGTGGGCT GGAAGGGTTT GATCAACGAT CCGCAGATGG ATAATAGCTT CCAGATCAAC 
GACGGCCTGC GTTTGGCGCG TAAGCTGCTG CTGGATATCA ATGATTCTGG CCTGCCGGCT 
GCCGGCGAAT TCCTCGACAT GATCACCCCG CAGTATCTGG CAGATCTGAT GAGCTGGGGC 
GCGATCGGCG CACGCACCAC GGAATCTCAG GTGCACCGCG AACTGTCTTC CGGCCTGTCT 
TGCCCGGTTG GCTTCAAAAA CGGCACCGAC GGTACCATTA AGGTGGCGAT TGATGCCATC 
AACGCCGCCA GCGCGCCGCA CTGTTTCCTG TCGGTAACCA AATGGGGCCA CTCGGCCATT 
GTTAACACCA GCGGTAACGG CGACTGTCAC ATCATTCTGC GCGGCGGCAA AGAGCCGAAC 
TACAGCGCGG CGCACGTGAA ACAAGTCAAA GAAGGCCTGG TTAAAGCGGG TCTGCCTGCA 
CAGGTGATGA TCGATTTTAG CCACGCCAAC AGCAGCAAGC AGTTCAAAAA GCAGCTGGAA 
GTGAACGCAG ACGTCTGCCA ACAGATTGCC GGCGGTGAAA AGGCGATTAT GGGCGTGATG 
ATCGAAAGCC ATCTGGTGGA AGGCAACCAG AACCTGGAAA GCGGCGATCC GCTGGTCTAC 
GGCAAGAGCG TCACCGACGC CTGCATCGGC TGGTCAGACA CCGAAACTGT ACTGCGTGAA 
CTGGCGGAAG CAGTGAAAGT GCGTCGCAAC AAGTAA

Protein sequence

MNYLNDDLRI KEIKELLPPV ALLEKFPATE RAAETVSQAR NAIHQILRGS DDRLLVVIGP 
CSIHDTKAAK EYAGRLLALR QELSGELEVV MRVYFEKPRT TVGWKGLIND PQMDNSFQIN 
DGLRLARKLL LDINDSGLPA AGEFLDMITP QYLADLMSWG AIGARTTESQ VHRELSSGLS 
CPVGFKNGTD GTIKVAIDAI NAASAPHCFL SVTKWGHSAI VNTSGNGDCH IILRGGKEPN 
YSAAHVKQVK EGLVKAGLPA QVMIDFSHAN SSKQFKKQLE VNADVCQQIA GGEKAIMGVM 
IESHLVEGNQ NLESGDPLVY GKSVTDACIG WSDTETVLRE LAEAVKVRRN K