Gene EcSMS35_3960 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3960
Symbol
ID	6146977
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	4038314
End bp	4039297
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	33%
IMG OID	641618786
Product	glycosyl transferase, group 2 family protein
Protein accession	YP_001745925
Protein GI	170681613
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0389703
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAATG ATTACCCTTT AGTATCCATA ATAATACCGA CGTATAATTC ATCTGATTAC 
ATTACTGAAA CTCTAACGAA ATTAGAAAAA CAAACTTACC CAAATTTTGA AATTGTTATT 
GTTAATGATG GTTCTAAAGA TAACACATCA AATGTTTTGA GAGAGTATGG GTTAACCCAC 
TCTCGATTAA TTATTCTCAA TAAAGAAAAT GGCGGTGTTT CGTCTGCCAG GAATACAGGT 
ATCCGCAAGG CGCAAGGACA GTTTATATGT TTTATGGATG ATGATGATGA GATAGATCCT 
AACTATCTGC TGAAGATGTA TTCCAGACAA CATGAGACGG GAGGGGATGC GATTTATTGT 
GGGCTTTATG GACATCATAT AAAAAATGGT GTTACTTACT CACCTATAAA TACAGATTTT 
AATGAAGGGT CTTTACTTTT CGATTTTTTT TATAAAAAGG TCAGATTCCA TATAGGGTGC 
TTGTTTATAA GAAAACAACT CCTGGAAGAT AATAATCTTT TTTTTGATGA AGATTTACGA 
CTAGGAGAAG ATCTGGATTT TATCTATCGA CTGCTAATTA CATGCGATAT GTATGCGGTT 
CCATATTATA TGTATAAGCA TAACTATAGA GAAAATTCCC TAATGAACTC ATGTAGAACC 
ATCACTCATT ATCGACATGA GTCATTTGCG CACGAAAGAA TCTACTCTTC TGTGATGCAG 
TTATACAAAG GTAACCGGAA AGAAGAAATT CATACATTAT TGAGTAAAAA TAGAACTTAT 
CATAAAACTC GTTATTTATG GAATGTTCTA CTTAATGGCG ATTTTGAATT ATTAAATCAA 
TTAGTTGAAA GCAATGAAAA AGAATTGAAA GATTGTAATC TTCTTGGCAA GAGAGATAAG 
AGGCGAGCAA AAATATTAGC ATCAAAAAAC TATATTCTCT GGAGGATGGT AAGACTGGTA 
AATAGAAAAA AGAATAAACG TTAG

Protein sequence

MSNDYPLVSI IIPTYNSSDY ITETLTKLEK QTYPNFEIVI VNDGSKDNTS NVLREYGLTH 
SRLIILNKEN GGVSSARNTG IRKAQGQFIC FMDDDDEIDP NYLLKMYSRQ HETGGDAIYC 
GLYGHHIKNG VTYSPINTDF NEGSLLFDFF YKKVRFHIGC LFIRKQLLED NNLFFDEDLR 
LGEDLDFIYR LLITCDMYAV PYYMYKHNYR ENSLMNSCRT ITHYRHESFA HERIYSSVMQ 
LYKGNRKEEI HTLLSKNRTY HKTRYLWNVL LNGDFELLNQ LVESNEKELK DCNLLGKRDK 
RRAKILASKN YILWRMVRLV NRKKNKR