Gene RoseRS_3663 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_3663
Symbol	clpX
ID	5210641
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	4585065
End bp	4586375
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	62%
IMG OID	640597256
Product	ATP-dependent protease ATP-binding subunit ClpX
Protein accession	YP_001277968
Protein GI	148657763
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1219] ATP-dependent protease Clp, ATPase subunit
TIGRFAM ID	[TIGR00382] endopeptidase Clp ATP-binding regulatory subunit (clpX)

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.76714
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.134529
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTCGCA CACGCAGCGG TAACGCAAAT TCGTCGAATA ATCGCGGTGC ATACCTCTGT 
TCGTTCTGTG GACGGGGACA GGAAGAGGTG CAGCGCCTGA TCGCCGGTCC CGGCAATGTG 
TTTATCTGCG ATGAGTGCGT CGCGCTGTGC AGCGCGATCA TCGCCGAAGA AACCGGGACA 
CGCCCGTCGA CCCGACGTTC CTCCGCCAGC CTGCCGGCGC GCCTGCCCAC GCCGCGCCGC 
CTGCGCGAAT GGCTCGATCA GTATGTCATC GGGCAGGATC GCGCAAAAGT GGTGCTATCG 
GTGGCGGTCT ATAACCACTA CAAGCGCCTC CGCGCCGGGC AGAATGCTGA TGATGTCGAG 
ATCGGCAAGA GCAATATTTT GCTGATCGGT CCGACCGGCA GCGGAAAGAC GTTGCTGGCG 
CAGACGCTGG CGCGAGTGCT CGATGTTCCC TTCGCTATCG CCGATGCCAC CGCGCTGACC 
GAGGCAGGGT ACGTCGGCGA GGATGTCGAA AACATTCTCC TGCGGTTGAT CCAGGCTGCC 
GAAGGTGATA TCGAACGCGC GCAGACCGGG ATCATCTACA TCGATGAGAT CGATAAAATT 
GCGCGCAAGA GTGATAATCC GTCGATTACG CGCGATGTGT CGGGCGAAGG GGTGCAACAG 
GCGTTGCTGA AGATTCTCGA AGGGTGCGTG GCGCATGTGC CGCCGGTTCC CGGTCGCAAA 
CATCCGCAGC AGGAGTATAT TTCGTTCGAT ACGACCCACG TGCTCTTCAT CTGCGGCGGC 
GCCTTCGAGG GTCTCGACAA AATCATCAGC CAGCGCATCG GCGGCAAGCG CAGCATCGGC 
TTCCACGCTG GCGAGTCTTC CGATGCTCCG GCATCGTTGC TGTCGCAGGT CACGCCGGAT 
GACCTGCTGC GCTACGGTTT CATCCCCGAA TTCGTCGGGC GGCTTCCGGT TGTCGCGGCG 
CTCGATCCGC TCGATAAGCA GGCAATGATC CGCATTCTGA CCGAGCCGCG CAATGCGATC 
ATCAAGCAGT ACCAGAAGAT GCTCGCCCTC GACCACGTTG AACTCGAGGT CACGCCCGAC 
GCGCTTGAAG CGATTGCGGA GCGGGCGCTC AGATCAAAGA CGGGCGCGCG CGCGCTGCGC 
ACGATCGTTG AGGAGATCCT GCTCGACGTG ATGTACGAAG TGCCTTCGCA GGAGCACATC 
GGGCGTTGCA TCATCAACGC CGAAGTGGTC GAAGGGCGCG GGCACCCGAT CCTGGTGCCG 
CGCTCCGCTG AACGGCAGGA GTACCGCCGA CGCATGGACG AGGCTGTGTA A

Protein sequence

MSRTRSGNAN SSNNRGAYLC SFCGRGQEEV QRLIAGPGNV FICDECVALC SAIIAEETGT 
RPSTRRSSAS LPARLPTPRR LREWLDQYVI GQDRAKVVLS VAVYNHYKRL RAGQNADDVE 
IGKSNILLIG PTGSGKTLLA QTLARVLDVP FAIADATALT EAGYVGEDVE NILLRLIQAA 
EGDIERAQTG IIYIDEIDKI ARKSDNPSIT RDVSGEGVQQ ALLKILEGCV AHVPPVPGRK 
HPQQEYISFD TTHVLFICGG AFEGLDKIIS QRIGGKRSIG FHAGESSDAP ASLLSQVTPD 
DLLRYGFIPE FVGRLPVVAA LDPLDKQAMI RILTEPRNAI IKQYQKMLAL DHVELEVTPD 
ALEAIAERAL RSKTGARALR TIVEEILLDV MYEVPSQEHI GRCIINAEVV EGRGHPILVP 
RSAERQEYRR RMDEAV