Gene Sala_2059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_2059
Symbol
ID	4080126
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	2169178
End bp	2170308
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	67%
IMG OID	638010433
Product	chaperone protein DnaJ
Protein accession	YP_617101
Protein GI	103487540
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0484] DnaJ-class molecular chaperone with C-terminal Zn finger domain
TIGRFAM ID	[TIGR02349] chaperone protein DnaJ

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.910721
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCTCG ACCTCGATTA TTACGAACTG CTCGAATGCG ATCGCAGCGC CGACGAAGCG 
GCGCTGAAAG CGAGCTACCG CAAGCTGGCG ATGAAATATC ACCCCGACAG GAATCCGGGG 
TGCAAGGACA GCGAAGCGCG CTTCAAGGCG ATCAACGAGG CCTATGACTG CCTTCGCGAT 
CCACAGAGAC GCGCCGCCTA TGACCGCTTC GGCAAGGCCG GCGTCAATGG CGGCGCGGGC 
GGTTTCGGCG GCGGGCATGG CAGCGATTTC GGCGACATCG GCGACATTTT CGAATCGATC 
TTCGGCTCCG CGTTCGGCGG CGCGCGCCAG CAGCGCGGCC CGGCGCGCGG CGCCGACCTG 
CGCTATGACA TGGAGATCCG GCTCGAGGAC GCCTTCACCG GCGTGACGCG CGAGATCGAG 
GTCGATGTCG CCGCGCGCTG CGACGCCTGC GACGGATCGG GTGCGAAGCC CGGCACCCGC 
ACGCACCGCT GTTCGACCTG CGGCGGCCAC GGCAAGGTGC GCGCGCAGCA GGGATTTTTC 
ATGGTCGAAC GCACCTGTCC CGCCTGTCAG GGCGCGGGCG AAGTCATCGC CGATCCATGC 
AATAGCTGCC ATGGCGAAGG CCGCGTCGAC CGGCGCAAGC GGCTCACCGT CACGATCCCG 
CCGGGGGTCG ACGAAGGCAC ACGCATCCGC CTGTCGGGCG AGGGCGAAAG CGGCGCGCGC 
GGCGCGGCGC CGGGCGACCT TTACATCTTC CTCCACATGG CGCGGCACAA ATTGTTCGAG 
CGCGAAGGCA CGACGCTGTT CACCCGCGCG CCGATCAGTT TCACCACCGC GGCGCTCGGC 
GGCTGCATCA CCATTCCCGG CCTCGACGGC CGCAAGCACG AAATCGCCAT CCCCGCGGGC 
ATCCAGTCGG GCAAGCAGCT CCGCCAGCGC GGCGCGGGGA TGCCCGTGCT CAACGGCCGC 
GGCCACGGCG ACCTGGTCAT CCAGATCGAC GTCGAAACCC CCACGCGGCT GACCGCGAAG 
CAGAAGGAAT TGCTGCAGGC GTTCCGCGAC ACCGAAACCG GCGAGGAATG CCCCGCAAGC 
CAGGGCTTTT TCGGGCGCAT CAAGGATATG TGGGAAGATC TGACGGATTA G

Protein sequence

MSLDLDYYEL LECDRSADEA ALKASYRKLA MKYHPDRNPG CKDSEARFKA INEAYDCLRD 
PQRRAAYDRF GKAGVNGGAG GFGGGHGSDF GDIGDIFESI FGSAFGGARQ QRGPARGADL 
RYDMEIRLED AFTGVTREIE VDVAARCDAC DGSGAKPGTR THRCSTCGGH GKVRAQQGFF 
MVERTCPACQ GAGEVIADPC NSCHGEGRVD RRKRLTVTIP PGVDEGTRIR LSGEGESGAR 
GAAPGDLYIF LHMARHKLFE REGTTLFTRA PISFTTAALG GCITIPGLDG RKHEIAIPAG 
IQSGKQLRQR GAGMPVLNGR GHGDLVIQID VETPTRLTAK QKELLQAFRD TETGEECPAS 
QGFFGRIKDM WEDLTD