Gene Spro_2172 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_2172
Symbol
ID	5605832
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	-
Start bp	2369126
End bp	2370172
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	60%
IMG OID	640937708
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_001478401
Protein GI	157370412
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0984452
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACAAAA CAGATGAACT GCGGACCGCG CGCATCGACA GCCTCGTCAC GCCGCAAGAG 
CTGGCGGAGA AGTTGCCAAT CTCGGCGGAA ATCGCGGACA ACGTGACGGC CTCACGGCAG 
CGAATTGAAA AAATTCTGAC CGGCGAAGAT CGTCGCCTGC TGGTGGTGAT CGGCCCCTGC 
TCTATTCACG ATCTTGACGC CGCCATCGAT TATGCCGGCC GGTTGAATGC GCTGCGCATC 
CGTTATCAGG ATCGCCTCGA AATCGTGATG CGCACCTATT TTGAAAAACC GCGCACCGTG 
GTGGGCTGGA AAGGCCTGAT CTCCGATCCG GCGCTGGATG GCACCTTCCA GGTCAATCGC 
GGGATCGAAA TGGCGCGTAG GCTGCTGCTG GAAGTGAACC AGCTCGGCCT GCCAACCGCC 
ACCGAGTTCC TGGACATGGT GGTCGGCCAA TACATTGCTG ATTTGATCAG TTGGGGCGCG 
ATTGGCGCAC GGACCACCGA AAGCCAGATC CACCGTGAAA TGGCTTCGGC ATTGTCCTGC 
CCGGTGGGCT TTAAAAACGG CACCGACGGC AACACCCGTA TCGCGATTGA CGCCATTCGT 
GCGGCCCGCG CCGGCCATAT GTTCCTGTCA CCGGACAAGC ACGGCCAGAT GACTATCTAT 
CAGACCAGCG GCAATCCTTA TGGCCATATC ATCATGCGTG GCGGCAAGAC GCCGAACTAC 
CACGCTACCG ATGTGGTCGC CGCCTGCGAC AGCCTGCGCG AATTCGATTT GCCGGAGCAA 
CTGGTGATCG ACTTCAGCCA CGGCAACTGC CAGAAATTGC ATCGTCGCCA ACTGGAAGTG 
GCCGAAAACG TCTGCCAGCA GATCCGCGCC GGTTCCGTCG CCGTTGCCGG CGTAATGGCA 
GAAAGCTTCC TGGTGGAAGG CACCCAGAAA ATCGTTGCCG GTCAGCCACT GACCTATGGG 
CAATCGATCA CCGACCCTTG CCTGAGCTGG TCCGACAGCG AACAGCTGCT GGCCATGCTG 
GCCGATGCGG TAGACACCCG CTTCTGA

Protein sequence

MHKTDELRTA RIDSLVTPQE LAEKLPISAE IADNVTASRQ RIEKILTGED RRLLVVIGPC 
SIHDLDAAID YAGRLNALRI RYQDRLEIVM RTYFEKPRTV VGWKGLISDP ALDGTFQVNR 
GIEMARRLLL EVNQLGLPTA TEFLDMVVGQ YIADLISWGA IGARTTESQI HREMASALSC 
PVGFKNGTDG NTRIAIDAIR AARAGHMFLS PDKHGQMTIY QTSGNPYGHI IMRGGKTPNY 
HATDVVAACD SLREFDLPEQ LVIDFSHGNC QKLHRRQLEV AENVCQQIRA GSVAVAGVMA 
ESFLVEGTQK IVAGQPLTYG QSITDPCLSW SDSEQLLAML ADAVDTRF