Gene RoseRS_1077 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_1077
Symbol
ID	5208023
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	1338730
End bp	1340370
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	62%
IMG OID	640594691
Product	chaperonin GroEL
Protein accession	YP_001275436
Protein GI	148655231
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAAAC AGGTGATATT CAACGAGCAG GCGCGCGCAG CGCTCAAGCA CGGCGTTGAT 
ACCCTGGCGC TCGCTGTGAA GACAACGCTT GGTCCTCGCG GGCGCAACGT TGCGATGGGC 
AAGAAATGGG GTGCACCCTC CGTCACCCAT GACGGCGTCA CCGTAGCGAA GGAGGTCGAA 
CTGAAGGACC CCTTCCAGAA TATGGGCGCC CAACTCCTCA AAGAAGCCGC CAGCAAAACG 
AACGATGTCG CCGGTGACGG CACAACAACG GCCACAGTGC TGGCGCAGGC GATGATCGAC 
GAAGGATTGA AACTGGTCGC CGCAGGCGCC AACCCCATGA TCTTCAAACG TGGTCTGGAT 
AAAGGGCGCG AGGCGCTGGT TGCACGCATC AAAGAGCAAT CGATCACCCT CAAGAGCCGT 
GACGAGATTC GCCAGGTAGC GACCATCTCC GCCCAAGACC CGGAGATCGG CGAGTTGCTG 
GCGACCATCA TGGATAAGAT CGGGCATGAT GGGGTCGTCA CCATCGAAGA GGGCAAAGGC 
ACAACCCTGG AGTACGAACT GGTCGAGGGC ATGCAGTTCG ACCGCGGGTA CATTTCGCCC 
TACTTCGTGA CCGATTCGAG CCGCATGGAG GCGGTCATCG ACGAGCCGTA CATCCTGATC 
ACCGACAAGA AGATCAGCGC CGTCAATGAT CTGCTCCCGA TTCTGGAGGC GGTGCTGGCG 
ACCGGCAAGA AGGACCTGGT GATCATTGCT GAAGATGTCG ATGGCGAAGC GCTGGCGACC 
CTGGTGGTCA ACAAGATGCG CGGCACCCTC AACGCGCTGG CGGTGAAGGC CCCCGGTTTT 
GGCGACCGCC GCAAAGCGAT GCTCCAGGAC ATCGCCATCC TGACCGGCGG CACGGTCATC 
AGTGAGGAGG TCGGGCGCAA ACTCGACAGC GCCAAAGTGC AAGACCTCGG TCGCGCTCGC 
CGGGTGAAGT CGGACAAAGA CAACACGGTG ATTGTCGAAG GGTTCGGCGA CAAGCAGGCG 
ATCCAGGCGC GCATCCGGCA GCTGAAGCAG CAGATCGAAA CCACGACATC GGACTACGAC 
CGTGAGAAAC TGCAGGAGCG CGTCGCCAAA CTGTCAGGCG GCGTGGCGGT GATCAAGGTC 
GGCGCTCCGA CCGAACCGGC GCTCAAGGAG CGCAAGGCGC GCGTTGAGGA TGCGCTGAAC 
GCGACCCGCG CCGCAGTCGA GGAAGGCATC GTACCGGGCG GCGGCATCGC GCTGTTGAAC 
GCCATCCCGG CGCTCGATAA TGTACAGACG CAGTTTGAGG AAGAGCGCAT GGCGCTGAAC 
ATTCTGCGCC GCGCGCTGGA AGAGCCGCTG CGCCAGCTGG CGATCAACGC CGGTGAGGAC 
GGCTCGGTGG TGGTGAATCA GGTGCGCACG CTCCAGCGTG AACACAACAA TCCGAACTAC 
GGGTTCGATG TGATGACCGG GAAATACGTT GATCTCATGC AGGCTGGCAT CATCGACCCG 
GCAAAGGTGG TGCGCACCGC GCTCGAGAAT GCGGTCAGCG TTGCAGGTAT CGTCCTGACG 
ACCGATGCGC TGATCACCGA TGCGCCGGAG CCGAAGAAGA ACGGTGCGCG CACGCCATCG 
ATGCCGGAGG AGGAGTTCTG A

Protein sequence

MAKQVIFNEQ ARAALKHGVD TLALAVKTTL GPRGRNVAMG KKWGAPSVTH DGVTVAKEVE 
LKDPFQNMGA QLLKEAASKT NDVAGDGTTT ATVLAQAMID EGLKLVAAGA NPMIFKRGLD 
KGREALVARI KEQSITLKSR DEIRQVATIS AQDPEIGELL ATIMDKIGHD GVVTIEEGKG 
TTLEYELVEG MQFDRGYISP YFVTDSSRME AVIDEPYILI TDKKISAVND LLPILEAVLA 
TGKKDLVIIA EDVDGEALAT LVVNKMRGTL NALAVKAPGF GDRRKAMLQD IAILTGGTVI 
SEEVGRKLDS AKVQDLGRAR RVKSDKDNTV IVEGFGDKQA IQARIRQLKQ QIETTTSDYD 
REKLQERVAK LSGGVAVIKV GAPTEPALKE RKARVEDALN ATRAAVEEGI VPGGGIALLN 
AIPALDNVQT QFEEERMALN ILRRALEEPL RQLAINAGED GSVVVNQVRT LQREHNNPNY 
GFDVMTGKYV DLMQAGIIDP AKVVRTALEN AVSVAGIVLT TDALITDAPE PKKNGARTPS 
MPEEEF