Gene EcHS_A2193 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2193
Symbol
ID	5594349
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	2175221
End bp	2176357
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	44%
IMG OID	640921326
Product	polysaccharide biosynthesis/export protein
Protein accession	YP_001458865
Protein GI	157161547
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1596] Periplasmic protein involved in polysaccharide export
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.00000597973
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAAA AAATTGTTAG ATTTTCGGCA TTAGCGTTGG CAATTGGGTT TTTATCGGGT 
TGTACCATTA TCCCTGGTCA GGGATTAAAC AGTCTGCGGA AAAACGTGGT TGAGCTACCG 
GACAGTGACT ACGATCTGGA TAAACTGGTT AATGTGTACC CTATGACTCC TGGGCTTATC 
GATCAACTTC GTCCAGAGAC CGTTCTGGCG AGACCTAACC CACAATTAGA TAATTTGCTC 
CGAAGCTATG AATATCGCAT TGGTGTGGGC GATGTATTGA TGGTTACGGT ATGGGATCAC 
CCGGAACTGA CAACGCCAGC AGGTCAGTAC CGTAGCGCCA GCGACACTGG TAACTGGGTT 
AACTCTGACG GTACCATTTT CTATCCATAT ATTGGTAAGG TGCAGGTGGC GGGCAAAACG 
CTTAGCCAGG TACGCCAGGA TATAGCCAAC CGATTGGCCA CTTATATTGA AAGCCCACAG 
GTTGATGTTA GCGTTGCTGC GTTTCGTTCT CAAAAGGTTT ACGTGACAGG CGAAGTGACA 
AAATCAGGCC AGCAACCTAT TACCAATATT CCTTTAACGG TTATGGATGC AATAAATGCC 
GCTGGTGGGC TGGCACCAGA CGCAGATTGG CGTAATGTTG TGCTGACTCA TAATGGTAAA 
GATACAAAAG TATCACTTTA TGCATTAATG CAAAAAGGGG ATTTAACACA AAATCATATG 
TTATATCCTG GAGATATTCT CTTTGTACCA AGGAATGACG ATCTTAAAGT GTTTGTCATG 
GGAGAGGTTG GCAAGCAGAG CACATTGAAG ATGGATCGTA GTGGAATGAC ATTAGCAGAG 
GCAATCGGGA ATGCGGAAGG CATGTCTCAA GCGTACAGTG ATGCCACGGG AGTCTTCGTT 
ATTCGCCAAC TGAAAGGTGA TAAACAAGGT AAAATTGCTA ATATCTATCA GTTGAACGCG 
CAAGATGCCT CCGCGATGGT TCTTGGTACA GAATTTGAAT TACAACCTTA TGATATCGTC 
TATGTCACAT CGGCTCCATT AGTACGTTGG AATCGTGTAA TTTCCCAACT TGTACCTACC 
ATTACTGGAG TACATGATAT GACAGAAACT GTAAGATATA TTAGGACCTG GCCATAA

Protein sequence

MKKKIVRFSA LALAIGFLSG CTIIPGQGLN SLRKNVVELP DSDYDLDKLV NVYPMTPGLI 
DQLRPETVLA RPNPQLDNLL RSYEYRIGVG DVLMVTVWDH PELTTPAGQY RSASDTGNWV 
NSDGTIFYPY IGKVQVAGKT LSQVRQDIAN RLATYIESPQ VDVSVAAFRS QKVYVTGEVT 
KSGQQPITNI PLTVMDAINA AGGLAPDADW RNVVLTHNGK DTKVSLYALM QKGDLTQNHM 
LYPGDILFVP RNDDLKVFVM GEVGKQSTLK MDRSGMTLAE AIGNAEGMSQ AYSDATGVFV 
IRQLKGDKQG KIANIYQLNA QDASAMVLGT EFELQPYDIV YVTSAPLVRW NRVISQLVPT 
ITGVHDMTET VRYIRTWP