Gene Spro_3946 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_3946
Symbol
ID	5603821
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	-
Start bp	4370879
End bp	4371895
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	57%
IMG OID	640939506
Product	erythrose 4-phosphate dehydrogenase
Protein accession	YP_001480169
Protein GI	157372180
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0057] Glyceraldehyde-3-phosphate dehydrogenase/erythrose-4-phosphate dehydrogenase
TIGRFAM ID	[TIGR01532] D-erythrose-4-phosphate dehydrogenase [TIGR01534] glyceraldehyde-3-phosphate dehydrogenase, type I

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.638165
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAATCC GCATAGCGAT AAACGGCTTT GGCCGCATTG GCCGCAGCGT TTTACGCGCA 
CTGTATGAAT CGGGACGAAG AGCGGAGATT TCCGTGGTGG CGATCAACGA ATTGGCAAAC 
GCCGAGGGGA TGGCCCACCT GCTGAAATAC GACTCCAGCC ATGGCCGCTT TGCCTGGGAT 
GTTCGCCAGG AATGCGACAT GCTGACCGTC GGGGACGACA CCATTCGCTT GCTGCATCAG 
CCGGCGGTGG AACAGCTTCC CTGGGGAGAG TTGGGTGTTG ACGTGGTACT GGACTGCAGC 
GGTGTGTACG GCAGCCGGGC AGATGGCGAA GCCCATCTGG CGGCGGGGGC GAAAAAAGTG 
TTGTTCGCCC ACCCAGGTGG TAACGATCTG GACGCCACCA TCGTGTTCGG CGTCAACCAT 
CAGACGCTGC TGGCAGAACA CCGCATTGTT TCCAATGCGT CATGCACCAC CAACTGCATT 
ATTCCGGTGA TTAAGCTGCT GGACGATGCC TACAGCATCG AATCGGGCAC CCTGACCACT 
ATTCACTCTT CGATGAACGA TCAGCCGGTG ATAGACGCCT ATCATCAGGA TTTGCGGCGT 
ACCCGTGCGG CGAGCCAGTC GATTATTCCG GTCGACACCA AGCTGGCCGC GGGCATCACC 
CGTATTTTTC CGCAGTTTTG CGATCGTTTC GAAGCGATTT CGGTGCGCGT GCCGACCATC 
AACGTGACGG CCATCGATCT CAGCGTCAGC GTCAGTTCGG CGGTGAAGGT GACAGAGGTC 
AACCAGCTGC TGCAAATGGC CGCACGGGGA TCATTTCGTG GTATAGTTGA CTATACGGAA 
CTACCATTAG TCTCGATCGA TTTTAACCAT GACCCGCATA GCGCTATCGT CGACGGTACG 
CAGACCCGGG TCAGCGGTCA GCACCTGATC AAGACCTTGG TCTGGTGTGA TAATGAATGG 
GGCTTTGCCA ACCGGATGTT GGATACAACA CGGGCAATGG CCGCAAGCGG TTTCTAG

Protein sequence

MTIRIAINGF GRIGRSVLRA LYESGRRAEI SVVAINELAN AEGMAHLLKY DSSHGRFAWD 
VRQECDMLTV GDDTIRLLHQ PAVEQLPWGE LGVDVVLDCS GVYGSRADGE AHLAAGAKKV 
LFAHPGGNDL DATIVFGVNH QTLLAEHRIV SNASCTTNCI IPVIKLLDDA YSIESGTLTT 
IHSSMNDQPV IDAYHQDLRR TRAASQSIIP VDTKLAAGIT RIFPQFCDRF EAISVRVPTI 
NVTAIDLSVS VSSAVKVTEV NQLLQMAARG SFRGIVDYTE LPLVSIDFNH DPHSAIVDGT 
QTRVSGQHLI KTLVWCDNEW GFANRMLDTT RAMAASGF