Gene EcolC_4223 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_4223
Symbol
ID	6067816
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4664354
End bp	4665619
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	52%
IMG OID	641603655
Product	ATP-dependent RNA helicase RhlB
Protein accession	YP_001727147
Protein GI	170022193
COG category	[J] Translation, ribosomal structure and biogenesis [K] Transcription [L] Replication, recombination and repair
COG ID	[COG0513] Superfamily II DNA and RNA helicases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0291518
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAAA CACATTTAAC AGAACAGAAG TTTTCCGACT TCGCCCTGCA TCCGAAGGTT 
GTAGAAGCCC TTGAAAAAAA AGGGTTTCAT AACTGTACGC CCATTCAGGC ACTGGCCCTT 
CCGCTGACGC TGGCGGGTCG TGACGTAGCC GGGCAGGCGC AAACCGGTAC CGGGAAAACG 
ATGGCGTTTC TTACGTCAAC GTTTCATTAT CTTCTCTCTC ATCCTGCGAT TGCCGATCGC 
AAGGTGAATC AACCGCGTGC CTTAATTATG GCACCGACGC GTGAACTTGC CGTGCAGATC 
CATGCCGACG CAGAACCGCT GGCGGAAGCT ACTGGCCTGA AGCTGGGTCT GGCTTACGGT 
GGTGATGGCT ACGACAAACA GCTGAAAGTG CTGGAAAGCG GCGTTGACAT TCTGATTGGC 
ACCACGGGTC GTTTAATTGA CTATGCCAAG CAGAACCATA TTAACCTCGG TGCCATTCAG 
GTAGTGGTAC TGGACGAAGC CGATCGCATG TACGATCTGG GCTTTATTAA AGATATCCGC 
TGGCTGTTCC GCCGTATGCC GCCTGCAAAC CAGCGCCTCA ACATGCTGTT CTCCGCCACG 
CTTTCGTACC GGGTACGTGA ACTGGCGTTC GAGCAGATGA ACAATGCCGA ATATATTGAA 
GTGGAACCGG AACAGAAAAC GGGCCACCGT ATTAAAGAAG AGCTTTTCTA CCCTTCTAAC 
GAAGAAAAAA TGCGTTTGCT GCAAACGCTG ATCGAAGAAG AGTGGCCAGA CAGAGCGATT 
ATTTTCGCCA ATACCAAACA CCGTTGTGAA GAGATCTGGG GCCACCTGGC GGCAGATGGT 
CATCGTGTCG GTTTGTTGAC AGGCGATGTC GCGCAGAAAA AACGTCTGCG TATTCTTGAT 
GAATTTACCC GTGGCGATCT GGATATTCTG GTTGCCACCG ACGTTGCCGC GCGTGGTTTG 
CATATTCCGG CAGTGACGCA CGTCTTTAAC TACGATTTAC CCGATGACTG TGAAGATTAC 
GTTCACCGTA TTGGTCGTAC AGGTCGCGCA GGCGCAAGCG GTCACTCTAT CAGCCTGGCG 
TGTGAAGAGT ATGCATTGAA TTTGCCTGCT ATTGAGACCT ATATTGGTCA CTCAATTCCG 
GTAAGCAAAT ACAATCCGGA CGCATTGATG ACCGATCTGC CAAAACCGCT GCGCCTCACG 
CGCCCGCGCA CAGGCAATGG TCCGCGTCGT ACTGGCGCTC CGCGTAATCG TCGTCGTTCA 
GGTTAA

Protein sequence

MSKTHLTEQK FSDFALHPKV VEALEKKGFH NCTPIQALAL PLTLAGRDVA GQAQTGTGKT 
MAFLTSTFHY LLSHPAIADR KVNQPRALIM APTRELAVQI HADAEPLAEA TGLKLGLAYG 
GDGYDKQLKV LESGVDILIG TTGRLIDYAK QNHINLGAIQ VVVLDEADRM YDLGFIKDIR 
WLFRRMPPAN QRLNMLFSAT LSYRVRELAF EQMNNAEYIE VEPEQKTGHR IKEELFYPSN 
EEKMRLLQTL IEEEWPDRAI IFANTKHRCE EIWGHLAADG HRVGLLTGDV AQKKRLRILD 
EFTRGDLDIL VATDVAARGL HIPAVTHVFN YDLPDDCEDY VHRIGRTGRA GASGHSISLA 
CEEYALNLPA IETYIGHSIP VSKYNPDALM TDLPKPLRLT RPRTGNGPRR TGAPRNRRRS 
G