Gene EcHS_A4009 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4009
Symbol
ID	5592221
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	4004691
End bp	4005941
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	53%
IMG OID	640923113
Product	polysaccharide biosynthesis protein
Protein accession	YP_001460584
Protein GI	157163266
COG category	[R] General function prediction only
COG ID	[COG2244] Membrane protein involved in the export of O-antigen and teichoic acid
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	0.419331
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGTTGG CAAAAGCGTC CTTGTGGACG GCGGCCAGTA CACTGGTCAA GATTGGTGCC 
GGGTTACTGG TCGGTAAGTT GCTGGCTGTG TCATTTGGTC CGGCGGGGCT TGGGCTGGCG 
GCAAATTTCC GCCAGTTGAT TACCGTGCTC GGCGTGCTTG CCGGAGCTGG CATCTTTAAC 
GGTGTAACCA AATACGTTGC CCAGTACCAT GATAATCCGC AACAGCTGCG CCGCGTGGTC 
GGCACTTCAT CAGCGATGGT ACTTGGTTTC TCTACGCTGA TGGCGCTGGT TTTTGTGCTG 
GCAGCTGCGC CAATCAGCCA GGGATTGTTT GGTAATACCG ACTATCAGGG GCTGGTGCGT 
TTAGTGGCGC TGGTGCAAAT GGGGATCGCC TGGGGCAACC TGTTACTGGC GCTGATGAAA 
GGCTTTCGCG ATGCCGCAGG TAATGCGTTA TCGCTGATTG TCGGCAGCTT GATTGGCGTT 
CTCGCGTACT ACGTCAGTTA CCGTTTGGGC GGTTATGAAG GGGCGTTGCT GGGTCTGGCG 
CTGATTCCCG CGCTGGTGGT AATTCCTGCC GCCATCATGT TGATCAAACG TGGTGTCATC 
CCGTTAAGCT ATCTGAAACC CAGCTGGGAT AACGGTCTGG CAGGGCAGTT GAGCAAATTT 
ACGCTCATGG CGTTGATTAC GTCGGTGACC TTGCCTGTTG CTTACATCAT GATGCGTAAA 
CTGCTGGCGG CGCAGTATAG CTGGGATGAG GTGGGGATCT GGCAAGGGGT GAGCAGTATT 
TCCGATGCCT ACCTGCAATT TATTACGGCA TCGTTCAGCG TATATTTGCT GCCCACGTTG 
TCGCGGCTAA CGGAAAAGCG CGATATCACC CGGGAAGTGG TTAAATCGCT GAAATTCGTC 
TTACCGGCAG TGGCGGCGGC GAGTTTTACC GTCTGGCTGC TGCGTGATTT TGCTATCTGG 
CTGCTGTTGT CGAATAAATT TACCGCTATG CGCGATCTCT TTGCCTGGCA GTTAGTGGGT 
GATGTGTTAA AAGTGGGCGC TTATGTCTTT GGTTATCTGG TGATCGCCAA AGCGTCACTG 
CGGTTTTATA TTCTGGCGGA AGTCAGCCAG TTCACTTTAT TGATGGTATT TGCCCACTGG 
CTAATCCCTG CGCATGGTGC ACTGGGCGCG GCGCAGGCAT ATATGGCAAC TTATATCGTC 
TATTTTTCTC TTTGTTGTGG CGTGTTTTTA CTCTGGCGTA GGCGGGCATG A

Protein sequence

MSLAKASLWT AASTLVKIGA GLLVGKLLAV SFGPAGLGLA ANFRQLITVL GVLAGAGIFN 
GVTKYVAQYH DNPQQLRRVV GTSSAMVLGF STLMALVFVL AAAPISQGLF GNTDYQGLVR 
LVALVQMGIA WGNLLLALMK GFRDAAGNAL SLIVGSLIGV LAYYVSYRLG GYEGALLGLA 
LIPALVVIPA AIMLIKRGVI PLSYLKPSWD NGLAGQLSKF TLMALITSVT LPVAYIMMRK 
LLAAQYSWDE VGIWQGVSSI SDAYLQFITA SFSVYLLPTL SRLTEKRDIT REVVKSLKFV 
LPAVAAASFT VWLLRDFAIW LLLSNKFTAM RDLFAWQLVG DVLKVGAYVF GYLVIAKASL 
RFYILAEVSQ FTLLMVFAHW LIPAHGALGA AQAYMATYIV YFSLCCGVFL LWRRRA