Gene EcSMS35_1000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1000
Symbol
ID	6146395
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1018324
End bp	1019463
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	54%
IMG OID	641615887
Product	polysaccharide biosynthesis/export protein
Protein accession	YP_001743079
Protein GI	170683770
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1596] Periplasmic protein involved in polysaccharide export
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAAAT CCAAAATGAA ATTGATGCCA TTATTGGTGT CAGTAACCTT GATAAGCGGT 
TGCACAGTAC TTCCGGGCAG CAATATGTCG ACGATGGGGA AAGACGTCAT CAAACAGCAG 
GACGCTGATT TCGATCTCGA CAAAATGGTG AATGTTTATC CGTTGACCCC GCGCCTGATT 
GATCAATTAC GCCCACGCCC GAATGTAGCG CGCCCCAATA TGACGCTGGA AAGTGAGATC 
GCGAATTATC AGTATCGCGT CGGGCCGGGA GACGTTCTTA ATGTCACCGT CTGGGATCAC 
CCGGAACTCA CCACGCCAGC CGGTCAGTAC CGCAGCTCCA GCGACACCGG CAACTGGGTA 
CAGCCTGACG GCACCATGTT CTACCCGTAT ATCGGCAAAG TTCACGTGGT GGGGAAAACG 
CTCGCTGAAA TCCGCAGTGA TATTACCGGG CGCTTAGCGA CGTACATCGC TGACCCGCAG 
GTGGACGTTA ATATCGCCGC CTTCCGCTCG CAAAAAGCCT ATATCTCCGG TCAGGTGAAT 
AAATCCGGTC AACAGGCGAT CACCAACGTG CCACTGACCA TTCTCGACGC CATCAACGCC 
GCAGGTGGCC TGACCGACAC CGCTGACTGG CGCAACGTGG TGCTAACACA CAATGGTCGT 
GAAGAGCGCA TTTCTTTGCA GGCGCTGATG CAAAACGGCG ACCTCAATCA GAACCGACTG 
CTTTACCCCG GCGATATTCT CTACGTGCCG CGTAATGATG ATCTGAAAGT GTTTGTGATG 
GGTGAAGTGA AGAAACAGAG CACCCTGAAA ATGGACTTTA GCGGCATGAC CCTGACTGAA 
GCCCTGGGCA ATGCTGAAGG TATCGACATG ACCACCTCCA ACGCCAGCGG CATCTTTGTC 
ATTCGTCCGT TGAAAGGCGA GGGCGGGCGT AACGGCAAGA TTGCCAATAT CTACCAGCTG 
GATATGTCCG ATGCCACGTC GCTGGTGATG GCGACAGAAT TCCGCCTGCA ACCTTATGAC 
GTGGTGTATG TCACCACCGC CCCGGTATCC CGCTGGAACC GTCTGATCAA TCAGTTGCTG 
CCAACTATTA GCGGTGTCCG TTACATGACG GATACAGCCA GCGACATTCA TAACTGGTAA

Protein sequence

MMKSKMKLMP LLVSVTLISG CTVLPGSNMS TMGKDVIKQQ DADFDLDKMV NVYPLTPRLI 
DQLRPRPNVA RPNMTLESEI ANYQYRVGPG DVLNVTVWDH PELTTPAGQY RSSSDTGNWV 
QPDGTMFYPY IGKVHVVGKT LAEIRSDITG RLATYIADPQ VDVNIAAFRS QKAYISGQVN 
KSGQQAITNV PLTILDAINA AGGLTDTADW RNVVLTHNGR EERISLQALM QNGDLNQNRL 
LYPGDILYVP RNDDLKVFVM GEVKKQSTLK MDFSGMTLTE ALGNAEGIDM TTSNASGIFV 
IRPLKGEGGR NGKIANIYQL DMSDATSLVM ATEFRLQPYD VVYVTTAPVS RWNRLINQLL 
PTISGVRYMT DTASDIHNW