Gene EcSMS35_4144 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4144
Symbol	rhlB
ID	6146084
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	4244012
End bp	4245277
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	52%
IMG OID	641618967
Product	ATP-dependent RNA helicase RhlB
Protein accession	YP_001746099
Protein GI	170679910
COG category	[J] Translation, ribosomal structure and biogenesis [K] Transcription [L] Replication, recombination and repair
COG ID	[COG0513] Superfamily II DNA and RNA helicases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAAA CACATTTAAC AGAACAGAAG TTTTCCGACT TCGCCCTGCA TCCGAAGGTT 
GTAGAAGCCC TTGAAAAAAA AGGGTTTCAT AACTGTACGC CCATTCAGGC ACTGGCCCTT 
CCGCTGACGC TGGCGGGTCG TGACGTAGCC GGGCAGGCGC AAACCGGTAC CGGGAAAACG 
ATGGCGTTTC TTACGTCAAC GTTTCATTAT CTTCTCTCTC ATCCTGCGAT AGCCGATCGC 
AAGGTGAATC AACCGCGTGC CTTAATTATG GCACCGACGC GTGAACTTGC CGTGCAGATC 
CACGCCGACG CGGAGCCACT TGCGCAAGCT ACCGGCCTGA AGCTGGGTCT GGCTTACGGT 
GGTGATGGCT ACGACAAACA GCTGAAAGTG CTGGAAAGCG GCGTTGACAT TCTGATTGGC 
ACCACGGGGC GTTTAATTGA CTACGCCAAG CAGAACCACA TTAACCTCTG TGCCATTCAG 
GTAGTGGTAC TGGACGAAGC CGATCGTATG TACGATCTGG GCTTTATTAA AGATATCCGC 
TGGCTGTTCC GCCGTATGCC GCCTGCAAAC CAGCGCCTCA ACATGCTGTT CTCCGCCACG 
CTTTCGTACC GGGTACGTGA ACTAGCGTTC GAGCAGATGA ACAATGCCGA ATATATTGAA 
GTGGAACCGG AACAGAAAAC GGGCCACCGT ATTAAAGAAG AGCTTTTCTA CCCTTCTAAC 
GAAGAAAAAA TGCGTTTGCT GCAAACGCTG ATCGAAGAAG AGTGGCCAGA CAGAGCGATT 
ATTTTCGCCA ACACCAAACA CCGTTGTGAA GAGATCTGGG GCCACCTGGC GGCAGATGGT 
CATCGTGTCG GTTTGTTGAC AGGCGATGTC GCGCAGAAAA AACGTCTGCG TATTCTTGAT 
GAATTTACCC GTGGGGATCT GGATATTCTG GTTGCCACCG ACGTTGCCGC GCGTGGTTTG 
CATATTCCGG CAGTGACGCA CGTCTTTAAC TACGATTTAC CCGATGACTG TGAAGATTAC 
GTTCACCGTA TTGGTCGTAC AGGTCGCGCA GGCGCAAGCG GTCACTCTAT CAGCCTGGCC 
TGTGAAGAGT ATGCATTGAA TTTGCCTGCT ATTGAGACCT ATATTGGTCA CTCAATTCCG 
GTAAGTAAAT ACAATCCGGA CGCATTGATG ACCGATCTGC CAAAACCGCT GCGCCTCACG 
CGCCCGCGCA CAGGCAATGG TCCGCGTCGT ACTGGCGCTC CGCGTAATCG TCGTCGTTCA 
GGTTAA

Protein sequence

MSKTHLTEQK FSDFALHPKV VEALEKKGFH NCTPIQALAL PLTLAGRDVA GQAQTGTGKT 
MAFLTSTFHY LLSHPAIADR KVNQPRALIM APTRELAVQI HADAEPLAQA TGLKLGLAYG 
GDGYDKQLKV LESGVDILIG TTGRLIDYAK QNHINLCAIQ VVVLDEADRM YDLGFIKDIR 
WLFRRMPPAN QRLNMLFSAT LSYRVRELAF EQMNNAEYIE VEPEQKTGHR IKEELFYPSN 
EEKMRLLQTL IEEEWPDRAI IFANTKHRCE EIWGHLAADG HRVGLLTGDV AQKKRLRILD 
EFTRGDLDIL VATDVAARGL HIPAVTHVFN YDLPDDCEDY VHRIGRTGRA GASGHSISLA 
CEEYALNLPA IETYIGHSIP VSKYNPDALM TDLPKPLRLT RPRTGNGPRR TGAPRNRRRS 
G