Gene Rcas_3046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3046
Symbol
ID	5540542
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	3948870
End bp	3950357
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	66%
IMG OID	640895165
Product	heat shock protein DnaJ domain-containing protein
Protein accession	YP_001433118
Protein GI	156742989
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0484] DnaJ-class molecular chaperone with C-terminal Zn finger domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.742448
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCTTG AACAGACGTG TCCCTCATGC AGCGCGACGC TGGGTTCTGA TGGGATTTGC 
CCGGCATGTG GTTCGGTGAC GCGCGGCTTT TTTCGCAGTC TCAACCTGGG CGCGCCACAG 
GTGGCGGCTG CTGTCGCGCA GGGGCTTGAC CTCTACCGGT TGCTCGGCGT CGATCAGCAC 
GCCGATGCAA TCACGATTGC GCGCCAGTAT CGTCGGTTGC GCGCGCTCTT TCCCGATGAC 
CCGTCTGCGC TGGCGGCAGA GCCGAGGCGC AAGTTCGAAT TGCTTCAGGT TGCCGGGCGC 
ATCTTGACCG ATCCCTCGCT GCGGGCGCTC TATAACGAAC TGCGGGTATC GGCTGCCGCC 
GGCATTCAGC AAGGCGTGGT GCGCTGTGAG TCGTGCGGCG CTCCGCTGCA AGGCAATGAG 
CCGCGCTGCC GCTACTGTGG TTCGCTGCGT CCGGGAGAAC CGGCGCCGCC AGCCACGCCG 
CCCGACGCCG GACCACCGGT TGCGGAGCCG GTTGATTTTT ATGCCCTGCT GGGACTCTCA 
CCCGCGCATC TGATGATCAA TCCGGGTGCT CGTCGCTCGG CGCGTCCGGC GCTGGATGCC 
GCAGAGATGT TGCACGAATC ACGACCGCCG ACGCCGGAAG AGGTCGATGC CGCTTCCTAC 
GCCTTTCAGC AGCGGACGCT CCTCCATCCT GGTTGGTCTG CCGCAGAACG TGAGGCGCGG 
GTAGAGAATC TGGAGATTGC CCGGCGCATT CTGCGGAACG AACGACTCCG CAATCGTTAC 
GATGCCTTCT GGCTGGCATT CCGTCAGGGT CGGTTCGACC ACGGTCACCT CGAAGGGTTG 
CGCGCGCTGA TCGATGAAGT GCGCGCAGAT GAAACGACGC CCTCGACACT TTCAGTGGAA 
GAGGCGGAAG CGCTGTTTCA ACAGGGTCGC GGGTTGCTTA CTGCCGGATT GCCGCGCGAA 
GCGCTCGATC CGTTGCGCCG GGCGCGTGAG GCGCTGCCGC ATTCCGCAGA GGCGCACGCA 
TGGTATGCCC GCGCCATCCT TGCGTCTGCC GACCCGCTCG ATCTCGGCGG ACACGCGCTG 
CGTCAGGCGC TGGTGGCTCT CGAAACCGCC GCTCGTTCTA GTGCGCCGCT TCCCGATAGT 
GAGTCGTACC TTGCTCTGTG TCGCGGGTTG CTGGCGCGTG ACGCAGGAGA TGCGCGCCAG 
GCGGAAATCG AATTGTTGCG CGCCGCACAA CAGAACCCCT CGCTGGCGCA CGCCTGGTGC 
GGATTGGCGG CTCTTGCGCT GGCGCGCGGG GCGAACGGCG ATGCTATCGA CCACTGCCAT 
CGGGCGCTGG CGATTGACCC GCGCGATGAG CGCGCCTGGT TGATGTTGGC AGGCGCCTGC 
CTGCGCACTC GACGCCATGC CGAGGCGCGC GCGGCGGCAG AGCGGGTTGC CGCGTTGCGC 
AGCGATGGTG TGAGCGCCGA GAAGATACTG TCCGAAATCG CAAACTGA

Protein sequence

MTLEQTCPSC SATLGSDGIC PACGSVTRGF FRSLNLGAPQ VAAAVAQGLD LYRLLGVDQH 
ADAITIARQY RRLRALFPDD PSALAAEPRR KFELLQVAGR ILTDPSLRAL YNELRVSAAA 
GIQQGVVRCE SCGAPLQGNE PRCRYCGSLR PGEPAPPATP PDAGPPVAEP VDFYALLGLS 
PAHLMINPGA RRSARPALDA AEMLHESRPP TPEEVDAASY AFQQRTLLHP GWSAAEREAR 
VENLEIARRI LRNERLRNRY DAFWLAFRQG RFDHGHLEGL RALIDEVRAD ETTPSTLSVE 
EAEALFQQGR GLLTAGLPRE ALDPLRRARE ALPHSAEAHA WYARAILASA DPLDLGGHAL 
RQALVALETA ARSSAPLPDS ESYLALCRGL LARDAGDARQ AEIELLRAAQ QNPSLAHAWC 
GLAALALARG ANGDAIDHCH RALAIDPRDE RAWLMLAGAC LRTRRHAEAR AAAERVAALR 
SDGVSAEKIL SEIAN