Gene ECH74115_5215 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5215
Symbol	rho
ID	6967884
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	4862919
End bp	4864178
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	50%
IMG OID	643388880
Product	transcription termination factor Rho
Protein accession	YP_002273300
Protein GI	209400658
COG category	[K] Transcription
COG ID	[COG1158] Transcription termination factor
TIGRFAM ID	[TIGR00767] transcription termination factor Rho

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	74
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCTTA CCGAATTAAA GAATACGCCG GTTTCTGAGC TGATCACTCT CGGCGAAAAT 
ATGGGGCTGG AAAACCTGGC TCGTATGCGT AAGCAGGACA TTATTTTTGC TATCCTGAAG 
CAGCACGCAA AGAGTGGCGA AGATATCTTT GGTGATGGCG TACTGGAGAT ATTGCAGGAT 
GGATTTGGTT TCCTCCGTTC CGCAGACAGC TCCTACCTCG CCGGTCCTGA TGACATCTAC 
GTTTCCCCTA GCCAAATCCG CCGTTTCAAC CTCCGCACTG GTGATACCAT CTCTGGTAAG 
ATTCGCCCGC CGAAAGAAGG TGAACGCTAT TTTGCGCTGC TGAAAGTTAA CGAAGTTAAC 
TTCGACAAAC CTGAAAACGC CCGCAACAAA ATCCTCTTTG AGAACTTAAC CCCGCTGCAC 
GCAAACTCTC GTCTGCGTAT GGAACGTGGT AACGGTTCTA CTGAAGATTT AACCGCTCGC 
GTACTGGATC TGGCATCACC TATCGGTCGT GGTCAGCGTG GTCTGATTGT GGCACCGCCG 
AAAGCCGGTA AAACCATGCT GCTGCAGAAC ATTGCTCAGA GCATTGCTTA CAACCACCCG 
GATTGTGTGC TGATGGTTCT GCTGATCGAC GAACGTCCGG AAGAAGTAAC CGAGATGCAG 
CGACTGGTAA AAGGTGAAGT TGTTGCTTCT ACCTTTGACG AACCCGCATC TCGCCACGTT 
CAGGTTGCGG AAATGGTGAT CGAGAAGGCG AAACGCCTGG TTGAGCACAA GAAAGACGTT 
ATCATTCTGC TCGACTCCAT CACTCGTCTG GCGCGCGCTT ACAACACCGT TGTTCCGGCG 
TCAGGTAAAG TGTTGACCGG TGGTGTGGAT GCCAACGCCC TGCATCGTCC GAAACGCTTC 
TTCGGTGCGG CGCGTAACGT GGAAGAGGGC GGCAGCCTGA CCATTATCGC GACGGCGCTT 
ATCGATACCG GTTCTAAAAT GGACGAAGTT ATTTACGAAG AGTTTAAAGG TACAGGCAAC 
ATGGAACTGC ACCTCTCTCG TAAGATCGCT GAAAAACGCG TCTTCCCGGC TATCGACTAC 
AACCGTTCCG GTACCCGTAA AGAAGAGCTG CTCACGACTC AGGAAGAACT GCAGAAAATG 
TGGATCCTGC GCAAAATCAT TCACCCGATG GGCGAAATCG ATGCAATGGA ATTCCTCATT 
AATAAACTGG CAATGACCAA GACCAATGAC GATTTCTTCG AAATGATGAA ACGCTCATAA

Protein sequence

MNLTELKNTP VSELITLGEN MGLENLARMR KQDIIFAILK QHAKSGEDIF GDGVLEILQD 
GFGFLRSADS SYLAGPDDIY VSPSQIRRFN LRTGDTISGK IRPPKEGERY FALLKVNEVN 
FDKPENARNK ILFENLTPLH ANSRLRMERG NGSTEDLTAR VLDLASPIGR GQRGLIVAPP 
KAGKTMLLQN IAQSIAYNHP DCVLMVLLID ERPEEVTEMQ RLVKGEVVAS TFDEPASRHV 
QVAEMVIEKA KRLVEHKKDV IILLDSITRL ARAYNTVVPA SGKVLTGGVD ANALHRPKRF 
FGAARNVEEG GSLTIIATAL IDTGSKMDEV IYEEFKGTGN MELHLSRKIA EKRVFPAIDY 
NRSGTRKEEL LTTQEELQKM WILRKIIHPM GEIDAMEFLI NKLAMTKTND DFFEMMKRS