Gene EcHS_A0557 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0557
Symbol	ushA
ID	5591143
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	570979
End bp	572631
Gene Length	1653 bp
Protein Length	550 aa
Translation table	11
GC content	51%
IMG OID	640919741
Product	bifunctional UDP-sugar hydrolase/5'-nucleotidase periplasmic precursor
Protein accession	YP_001457325
Protein GI	157160007
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0737] 5'-nucleotidase/2',3'-cyclic phosphodiesterase and related esterases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	52
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTAT TGCAGCGGGG CGTGGCGTTA GCGCTGTTAA CCACATTTAC ACTGGCGAGT 
GAAACTGCTC TGGCGTATGA GCAGGATAAA ACCTACAAAA TTACAGTTCT GCATACCAAT 
GATCATCATG GGCATTTTTG GCGCAATGAA TATGGCGAAT ATGGTCTGGC GGCGCAAAAA 
ACGCTGGTGG ATGGTATCCG CAAAGAGGTT GCGGCTGAAG GCGGTAGCGT GCTGCTACTT 
TCCGGTGGCG ACATTAACAC TGGCGTGCCC GAGTCTGACT TACAGGATGC CGAACCTGAT 
TTTCGCGGTA TGAATCTGGT GGGCTATGAC GCGATGGCGA TCGGTAATCA TGAATTTGAT 
AATCCGCTCA CCGTATTACG CCAGCAGGAA AAGTGGGCCA AGTTCCCGTT GCTTTCCGCG 
AATATCTACC AGAAAAGTAC TGGCGAGCGC CTGTTTAAAC CGTGGGCGCT GTTTAAGCGT 
CAGGATCTGA AAATTGCCGT TATTGGGCTG ACAACCGATG ACACAGCAAA AATTGGTAAC 
CCGGAATACT TCACTGATAT CGAATTTCGT AAGCCCGCCG ATGAAGCGAA GCTGGTGATT 
CAGGAGCTGC AACAGACAGA AAAGCCAGAC ATTATTATCG CGGCGACCCA TATGGGGCAT 
TACGATAATG GTGAGCACGG CTCTAACGCA CCGGGCGATG TGGAGATGGC ACGCGCGCTG 
CCTGCCGGAT CGCTGGCGAT GATCGTCGGT GGTCACTCGC AAGATCCGGT CTGCATGGCG 
GCAGAAAACA AAAAACAGGT CGATTACGTG CCGGGTACGC CATGCAAACC AGATCAACAA 
AACGGCATCT GGATTGTGCA GGCGCATGAG TGGGGCAAAT ACGTGGGACG GGCTGATTTT 
GAGTTTCGTA ATGGCGAAAT GAAAATGGTT AACTACCAGC TGATTCCGGT GAACCTGAAG 
AAGAAAGTGA CCTGGGAAGA CGGGAAAAGC GAGCGCGTGC TTTACACTCC TGAAATCGCT 
GAAAACCAGC AAATGATCTC GCTGTTATCA CCGTTCCAGA ACAAAGGCAA AGCGCAGCTG 
GAAGTGAAAA TAGGCGAAAC CAATGGTCGT CTGGAAGGCG ATCGTGACAA AGTGCGTTTT 
GTACAGACCA ATATGGGGCG GTTGATTCTG GCAGCCCAAA TGGATCGCAC TGGTGCCGAC 
TTTGCGGTGA TGAGCGGAGG CGGAATTCGT GATTCTATCG AAGCAGGCGA TATCAGCTAT 
AAAAACGTGC TGAAAGTGCA GCCATTCGGC AATGTGGTGG TGTATGCCGA CATGACCGGT 
AAAGAGGTGA TTGATTACCT GACCGCCGTC GCGCAGATGA AGCCAGATTC AGGTGCCTAC 
CCGCAATTTG CCAACGTTAG CTTTGTGGCG AAAGACGGCA AACTGAACGA CCTTAAAATC 
AAAGGCGAAC CGGTCGATCC GGCGAAAACT TACCGTATGG CGACATTAAA CTTCAATGCC 
ACCGGCGGTG ATGGATATCC GCGCCTTGAT AACAAACCGG GCTATGTGAA TACCGGCTTT 
ATTGATGCCG AAGTGCTGAA AGCGTATATC CAGAAAAGCT CGCCGCTGGA GGTGAGTGTT 
TATGAACCGA AAGGTGAGGT GAGCTGGCAG TAA

Protein sequence

MKLLQRGVAL ALLTTFTLAS ETALAYEQDK TYKITVLHTN DHHGHFWRNE YGEYGLAAQK 
TLVDGIRKEV AAEGGSVLLL SGGDINTGVP ESDLQDAEPD FRGMNLVGYD AMAIGNHEFD 
NPLTVLRQQE KWAKFPLLSA NIYQKSTGER LFKPWALFKR QDLKIAVIGL TTDDTAKIGN 
PEYFTDIEFR KPADEAKLVI QELQQTEKPD IIIAATHMGH YDNGEHGSNA PGDVEMARAL 
PAGSLAMIVG GHSQDPVCMA AENKKQVDYV PGTPCKPDQQ NGIWIVQAHE WGKYVGRADF 
EFRNGEMKMV NYQLIPVNLK KKVTWEDGKS ERVLYTPEIA ENQQMISLLS PFQNKGKAQL 
EVKIGETNGR LEGDRDKVRF VQTNMGRLIL AAQMDRTGAD FAVMSGGGIR DSIEAGDISY 
KNVLKVQPFG NVVVYADMTG KEVIDYLTAV AQMKPDSGAY PQFANVSFVA KDGKLNDLKI 
KGEPVDPAKT YRMATLNFNA TGGDGYPRLD NKPGYVNTGF IDAEVLKAYI QKSSPLEVSV 
YEPKGEVSWQ