Gene EcHS_A0425 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0425
Symbol
ID	5595106
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	446684
End bp	447880
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	50%
IMG OID	640919610
Product	glycosyl transferase, group 2 family protein
Protein accession	YP_001457195
Protein GI	157159877
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAACCT GGATATTTAT CTGTATGTCC ATAGCAATGT TGCTATGGTT TTTAAGTACG 
CTAAGACGTA AACCCAGTCA AAAGAAAGGC TGTATTGACG CCATTATACC TGCGTATAAC 
GAAGGCCCGT GTCTGGCGCA GTCACTGGAT AATCTACTGC GTAACCCTTA TTTTTGCCGG 
GTAATTTGCG TTAACGACGG CTCCACGGAC AATACCGAAG CGGTCATGGC GGAAGTCAAA 
CGCAAATGGG GCGACCGCTT TGTTGCCGTC ACGCAAAAAA ATACCGGTAA AGGTGGTGCG 
CTGATGAATG GCCTCAATTA TGCCACCTGC GACCAGGTTT TTTTAAGTGA TGCCGACACC 
TATGTTCCGC CCGATCAAGA CGGAATGGGC TATATGCTGG CAGAAATTGA GCGCGGTGCT 
GATGCCGTAG GCGGCATTCC CTCTACTGCG TTGAAAGGCG CGGGGCTGTT ACCGCACATC 
CGCGCGACCG TAAAGTTGCC GATGATTGTT ATGAAGCGCA CGCTACAGCA GCTCCTGGGC 
GGCGCACCGT TTATTATCAG CGGTGCCTGC GGGATGTTCC GTACTGATGT ATTGCGTAAG 
TTCGGTTTCT CGGATCGTAC TAAAGTCGAA GACCTTGATC TCACCTGGAC ATTAGTGGCA 
AACGGCTACC GTATTCGGCA GGCGAATCGC TGCATCGTAT ACCCACAGGA ATGCAACAGC 
CCGCGTGAGG AGTGGCGTCG CTGGCGGCGT TGGATTGTGG GATACGCGGT CTGTATGCGC 
CTGCATAAAA GACTTTTATT TAGCCGCTTC GGTATCTTCA GTATATTTCC TATGCTGTTG 
GTTGTGCTTT ATGGCGTTGG GATTTATCTC ACTACCTGGT TTAATGAATT CATCACCACC 
GGGCCGCATG GTGTGGTGTT GGCAATGTTT CCGCTTATCT GGATCGGCGT AGTTTGTGTT 
ATTGGTGCTT TTAGCGCCTG GTTTCATCGT TGCTGGTTGT TGGTGCCTTT AGCGCCGCTT 
TCCGTTGTGT ATGTATTATT AGCTTATGCC ATCTGGATTA TTTATGGACT TATTGCCTTT 
TTTACTGGAC GCGAACCTCA GCGCGACAAA CCCACCCGCT ATTCCGCACT GGTGGAAGCG 
TCAACCGCTT ATTCCCAACC TTCTGTCACA GGAACTGAAA AACTATCTGA AGCTTAA

Protein sequence

MKTWIFICMS IAMLLWFLST LRRKPSQKKG CIDAIIPAYN EGPCLAQSLD NLLRNPYFCR 
VICVNDGSTD NTEAVMAEVK RKWGDRFVAV TQKNTGKGGA LMNGLNYATC DQVFLSDADT 
YVPPDQDGMG YMLAEIERGA DAVGGIPSTA LKGAGLLPHI RATVKLPMIV MKRTLQQLLG 
GAPFIISGAC GMFRTDVLRK FGFSDRTKVE DLDLTWTLVA NGYRIRQANR CIVYPQECNS 
PREEWRRWRR WIVGYAVCMR LHKRLLFSRF GIFSIFPMLL VVLYGVGIYL TTWFNEFITT 
GPHGVVLAMF PLIWIGVVCV IGAFSAWFHR CWLLVPLAPL SVVYVLLAYA IWIIYGLIAF 
FTGREPQRDK PTRYSALVEA STAYSQPSVT GTEKLSEA