Gene EcHS_A0749 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0749
Symbol
ID	5592505
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	760300
End bp	761733
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	55%
IMG OID	640919926
Product	RHS repeat-containing protein
Protein accession	YP_001457500
Protein GI	157160182
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3209] Rhs family protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.00294679
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTGGCCGG ATAACCGTAT CGCCCGTGAC GCGCACTATC TTTACCGGTA TGACCGTCAC 
GGCAGGCTGA CGGAGAAAAC CGACCTCATC CCGGAAGGGG TTATCCGCAC GGATGATGAG 
CGCACCCACC GGTACCATTA CGACAGTCAG CACCGGCTGG TGCACTACAC GCGGACACAA 
TATGCAGAGC CGCTGGTCGA AAGCCGCTAT CTTTACGACC CGCTGGGCCG CAGGGTGGCA 
AAACGGGTGT GGCGACGTGA ACGGGACCTG ACGGGCTGGA TGTCGCTGTC ACGGAAACCG 
CAAGTGACCT GGTACGGCTG GGACGGCGAC CGCCTGACCA CAATACAGAA CGACAGAACC 
CGCATCCAGA CGATTTATCA GCCGGGGAGC TTCACGCCAC TCATCAGGGT TGAAACCGCC 
ACCGGTGAGC AGGCGAAAAC GCAGCGCCGC AGCCTGGCGG ATACCCTTCA GCAGTCCGGC 
GGCGAAGACG GTGGCAGTGT GGTGTTCCCG CCGGTGCTGG TGCAGATGCT CGACCGGCTG 
GAAAGTGAAA TCCTGGCTGA CCGGGTGAGT GAGGAAAGCC GCCGCTGGCT GGCATCGTGC 
GGCCTGACGG TGGAGCAGAT GCAAAACCAG ATGGACCCGG TGTACACGCC GGCGCGAAAA 
ATCCACCTGT ACCACTGCGA CCATCGCGGC CTGCCGCTGG CGCTTGTCAG CACGGAAGGG 
GCAACAGAAT GGTGCGCAGA ATACGATGAA TGGGGCAACC TGCTGAATGA AGAGAACCCG 
CATCAGCTGC AGCAGCTTAT CCGCCTGCCG GGGCAGCAGT ATGATGAGGA GTCCGGCCTG 
TATTACAACC GCCACCGCTA TTATGACCCG CTGCAGGGGA GGTATATCAC TCAGGATCCG 
ATTGGGCTGA AGGGGGGATG GAATTTTTAT CAGTATCCGC TGAATCCGGT TCAGTATATA 
GATTCAATGG GACTGGCATC AAAATATGGA CACTTAAATA ATGGCGGATA TGGAGCGAGA 
CCCAACAAAC CGCCTACGCC CGATCCAAGT AAATTGCCGG ACATAGCGAA ACAATTAAGA 
CTGCCATATC CTATTGACCA GGCCAGTAGT GCGCCTAATC TTTTCAAAAC ATTCTTCAGA 
GCATTAAGCC CTTACGACTA CACACTGTAT TGCAGGAAGT GGGTAAAACC AAATCTGACT 
TGTACGCCAC AGGATGATTC CCAGTATCCA GGGATGGATA CAAAGACAGC AAGTGATTAC 
CTGCCACAGA CAAATTGGCC AACAACTCAA TTACCACCAG GATATACTTG TGCAGAACCC 
TATTTATTCC CAGACATTAA TAAACCCGAT GGGCCAGCAA CAGCAGGGAT AGATGATTTG 
GGTGAAATTT TAGCTAAGAT GAAACAGAGA ACATCGAGAG GAATAAGAAA ATGA

Protein sequence

MWPDNRIARD AHYLYRYDRH GRLTEKTDLI PEGVIRTDDE RTHRYHYDSQ HRLVHYTRTQ 
YAEPLVESRY LYDPLGRRVA KRVWRRERDL TGWMSLSRKP QVTWYGWDGD RLTTIQNDRT 
RIQTIYQPGS FTPLIRVETA TGEQAKTQRR SLADTLQQSG GEDGGSVVFP PVLVQMLDRL 
ESEILADRVS EESRRWLASC GLTVEQMQNQ MDPVYTPARK IHLYHCDHRG LPLALVSTEG 
ATEWCAEYDE WGNLLNEENP HQLQQLIRLP GQQYDEESGL YYNRHRYYDP LQGRYITQDP 
IGLKGGWNFY QYPLNPVQYI DSMGLASKYG HLNNGGYGAR PNKPPTPDPS KLPDIAKQLR 
LPYPIDQASS APNLFKTFFR ALSPYDYTLY CRKWVKPNLT CTPQDDSQYP GMDTKTASDY 
LPQTNWPTTQ LPPGYTCAEP YLFPDINKPD GPATAGIDDL GEILAKMKQR TSRGIRK