Gene EcHS_A3050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3050
Symbol	prfB
ID	5592155
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3062697
End bp	3063795
Gene Length	1099 bp
Protein Length	365 aa
Translation table	11
GC content	53%
IMG OID	640922167
Product	peptide chain release factor 2
Protein accession	YP_001459669
Protein GI	157162351
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1186] Protein chain release factor B
TIGRFAM ID	[TIGR00020] peptide chain release factor 2

Plasmid Coverage information

Num covering plasmid clones	62
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTGAAA TTAATCCGGT AAATAATCGC ATTCAGGACC TCACGGAACG CTCCGACGTT 
CTTAGGGGGT ATCTTTGACT ACGACGCCAA GAAAGAGCGT CTGGAAGAAG TAAACGCCGA 
GCTGGAACAG CCGGATGTCT GGAACGAACC CGAACGCGCA CAGGCGCTGG GTAAAGAGCG 
TTCCTCCCTC GAAGCCGTTG TCGACACCCT CGACCAAATG AAACAGGGGC TGGAAGATGT 
TTCTGGTCTG CTGGAACTGG CTGTAGAAGC TGACGACGAA GAAACCTTTA ACGAAGCCGT 
TGCTGAACTC GACGCCCTGG AAGAAAAACT GGCGCAGCTT GAGTTCCGCC GTATGTTCTC 
TGGCGAATAT GACAGCGCCG ACTGCTACCT CGATATTCAG GCGGGGTCTG GCGGTACGGA 
AGCACAGGAC TGGGCGAGCA TGCTTGAGCG TATGTATTTG CGCTGGGCAG AATCGCGTGG 
TTTCAAAACT GAAATCATCG AAGAGTCGGA AGGTGAAGTG GCGGGTATTA AATCCGTGAC 
GATCAAAATC TCCGGCGATT ACGCTTACGG CTGGCTGCGT ACAGAAACTG GCGTTCACCG 
CCTGGTGCGT AAGAGCCCGT TTGACTCCGG CGGTCGTCGC CACACGTCGT TCAGCTCCGC 
GTTTGTTTAT CCGGAAGTTG ATGATGATAT TGATATCGAA ATCAACCCGG CGGATTTGCG 
CATTGACGTT TATCGCGCGT CCGGCGCGGG CGGTCAGCAC GTTAACCGTA CCGAATCTGC 
GGTGCGTATT ACCCACATCC CGACCGGGAT CGTGACCCAG TGCCAGAACG ACCGTTCCCA 
GCACAAGAAC AAAGACCAGG CCATGAAGCA GATGAAAGCG AAGCTTTATG AACTGGAGAT 
GCAGAAGAAA AATGCTGAGA AACAGGCGAT GGAAGATAAC AAATCTGACA TCGGCTGGGG 
CAGCCAGATT CGTTCTTATG TCCTTGATGA CTCCCGCATT AAAGATCTGC GCACCGGGGT 
AGAAACCCGC AACACGCAGG CCGTGCTGGA CGGCAGCCTG GATCAATTTA TCGAAGCAAG 
TTTGAAAGCA GGGTTATGA

Protein sequence

MFEINPVNNR IQDLTERSDV LRGYLCYDAK KERLEEVNAE LEQPDVWNEP ERAQALGKER 
SSLEAVVDTL DQMKQGLEDV SGLLELAVEA DDEETFNEAV AELDALEEKL AQLEFRRMFS 
GEYDSADCYL DIQAGSGGTE AQDWASMLER MYLRWAESRG FKTEIIEESE GEVAGIKSVT 
IKISGDYAYG WLRTETGVHR LVRKSPFDSG GRRHTSFSSA FVYPEVDDDI DIEINPADLR 
IDVYRASGAG GQHVNRTESA VRITHIPTGI VTQCQNDRSQ HKNKDQAMKQ MKAKLYELEM 
QKKNAEKQAM EDNKSDIGWG SQIRSYVLDD SRIKDLRTGV ETRNTQAVLD GSLDQFIEAS 
LKAGL