Gene EcHS_A3834 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3834
Symbol
ID	5592837
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3829874
End bp	3830857
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	32%
IMG OID	640922946
Product	glycosyl transferase, group 2 family protein
Protein accession	YP_001460424
Protein GI	157163106
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.00000153474
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAATG ATTACCCTTT AGTATCCATA ATAATACCGA CGTATAATTC ATCTGATTAC 
ATTACTGAAA CTCTAACGAA ATTAGAAAAA CAAACTTACC CAAATTTTGA AATTGTTATT 
GTTAATGATG GTTCTAAAGA CAACACATCA AACGTTTTGA GAGAGTATGG GTTAACCCAC 
TCTCGATTAA TTATTATCAA TAAAGAAAAT GGCGGTGTTT CGTCTGCCAG GAATACAGGT 
ATCCGCAAGG CGCAAGGACA GTTTATATGT TTTATGGATG ATGATGATGA GATAGATCCT 
AACTATCTGC TGAAGATGTA TTCCAGACAA CATGAGACGG GAGGAGATGC CATTTATTGT 
GGGCTTTATG GCCATCATAT AAAAAATGGT GTTACTTACT CACCTATAAA TACAGAGTTT 
AATGAAGGAT CTTTACTTTT CGACTTTTTT TATAAAAAGG TTAGATTCCA TATAGGGTGC 
TTGTTTATAA GAAAACAACT TCTGGAAGAG AATAATCTTT TTTTTGATGA AGATTTACGA 
CTAGGAGAAG ATCTGGATTT TATCTATCGA CTGCTAATTA CATGCGATAT GTATGCGGTT 
CCATATTATA TGTATAAGCA TAACTATAGA GAAAATTCCT TAATGAACTC ATGTAGAACC 
ATCACTCATT ATCGACATGA GTCATTTGCG CACGAAAAAA TCTACTCTTC TGTGATGCAG 
TTATACAAAG GTAACCGGAA AGAAGAAATT CATACATTAT TGAGTCAAAA TAGAGCTTAT 
CATAAAACTC GTTATTTGTG GAATGTTCTA CTTAATGGTG ATTTTAAACA ATTGAATCAA 
TTAGTTGAAA GCAATGAAAA AGAATTAAAA GATTGTAATC TTCCTGGCAA GAGAGATAAG 
AGACGAGCAA AAATATTAGC ATCAAAAAAT TATATTATCT GGAGGATGGT AAGACTGGTA 
AATAGAAAAA AGAATAAACG TTAG

Protein sequence

MSNDYPLVSI IIPTYNSSDY ITETLTKLEK QTYPNFEIVI VNDGSKDNTS NVLREYGLTH 
SRLIIINKEN GGVSSARNTG IRKAQGQFIC FMDDDDEIDP NYLLKMYSRQ HETGGDAIYC 
GLYGHHIKNG VTYSPINTEF NEGSLLFDFF YKKVRFHIGC LFIRKQLLEE NNLFFDEDLR 
LGEDLDFIYR LLITCDMYAV PYYMYKHNYR ENSLMNSCRT ITHYRHESFA HEKIYSSVMQ 
LYKGNRKEEI HTLLSQNRAY HKTRYLWNVL LNGDFKQLNQ LVESNEKELK DCNLPGKRDK 
RRAKILASKN YIIWRMVRLV NRKKNKR