Gene Rcas_4441 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4441
Symbol
ID	5541954
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5710033
End bp	5710998
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	63%
IMG OID	640896539
Product	heat shock protein DnaJ domain-containing protein
Protein accession	YP_001434475
Protein GI	156744346
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0484] DnaJ-class molecular chaperone with C-terminal Zn finger domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.342346
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAACGC AGGATTTCTA CGACATCTTG CAGGTTGCGC CCGACGCTGA TGAAGAGGCG 
ATTTGCGCCG CTTATCAGCG TCTGCGCGAA CAGTATGATC CGCAAAAGTT GAACGGCGCC 
GCTGCGGAAC TGGTCGAACT AGCGCAGCAG CGCCTGTCAC GCATCGACGA GGCATACGCG 
ACGCTCTCTG ATGCGCAGCG CCGCGCACAG TACGATGCGC AGCGTCAGGC GTCTCTCCAG 
GACGTGCCCG ATTACCGTCC GCTTCCCCCA GCACAGCACG CAGAACGCCC CCGTGATTTC 
AACCCCCGTC CGACCATCAA CCAGCCAGCG GCGGCGGCAA TTGCGGGTCC GGCAGCAGCG 
GTGATTGCGG TGCTGGCGAT TGCGCTGGTA TCGATCATTG GCGGATTAAT CTTGACCGGT 
GGCGGAAGTG TGCCGCAAGC GGTCCCTACT CCCACAACTT CGCCGATGGA CGCGCTGGAG 
ACCATGATCG CCCGCGCCCG TCAGATTGCT GAACAGAACG AGAACGATGC GCAGGCGTGG 
TTGGACTATG CCAACCTCCT CTACGACAGT GTCCAGATTG TGCGCGAACA GGCGCCCAAT 
AGCGTGCTGT ATCAGCAACG CCTGCCGCGC TGGCTCGAAG CGGCAAAGGC TTATGAGCGC 
GTCCTCGAAC TCGATCCGAC CAACGCAGTC GCGCGCGGCG ACCTCGGCGC CTCCCGCTGT 
TTCTATGGCG CCGGCGTGGG GGATCAGACG TTTGTGGTGG AGGGATTGAA GGACCTGGAG 
ACGGCCACCG CAGCACGCCC CGAAGATACG CGCCTGCTGC TCAATCTTGG CTCGTGCCTG 
GCATCGGCCC AACCGCCGCG CACCGACGAA GCCATCGAGG TCTGGCAGCG CATTATCTCA 
ATTGCGCCAA CCGGATCGCC CGTCGCCAAC GAAGCGCAGC GTCTGATCGA TCAGGTGCGC 
AGGTAG

Protein sequence

MATQDFYDIL QVAPDADEEA ICAAYQRLRE QYDPQKLNGA AAELVELAQQ RLSRIDEAYA 
TLSDAQRRAQ YDAQRQASLQ DVPDYRPLPP AQHAERPRDF NPRPTINQPA AAAIAGPAAA 
VIAVLAIALV SIIGGLILTG GGSVPQAVPT PTTSPMDALE TMIARARQIA EQNENDAQAW 
LDYANLLYDS VQIVREQAPN SVLYQQRLPR WLEAAKAYER VLELDPTNAV ARGDLGASRC 
FYGAGVGDQT FVVEGLKDLE TATAARPEDT RLLLNLGSCL ASAQPPRTDE AIEVWQRIIS 
IAPTGSPVAN EAQRLIDQVR R