Gene Caul_3900 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3900
Symbol
ID	5901362
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4219589
End bp	4220530
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	72%
IMG OID	641564421
Product	heat shock protein DnaJ domain-containing protein
Protein accession	YP_001685523
Protein GI	167647860
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0484] DnaJ-class molecular chaperone with C-terminal Zn finger domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.195824
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGCGCGCG ACCCGTATCT GGAGCTTGGC GTTTCCCGCA CCGCGAGCGC GGCGGAAATC 
CGCAAGGCGT TCCACAAGCT CGCCAAGCAG CATCACCCCG ACGCCAACAA GGGCGACAAG 
AAGTCCGAGG AGCGCTTCAA GCAGGTCAGC GCCGCCTTCG ACATCCTGGG CGACGCCGAC 
AAGCGCAAGA AGTTCGACGC CGGCGAGATC GACGCCGACG GCCGCGAGAC CATGCGGGCC 
GGCGGGTTCG GCGGCGGCGG CTCGCCGTTT GGCGGCGGCT TCAACCGCAG CGGCGGCTTT 
GGACGCGGGG GCGGCGCGGC CGAGGGACCC GAGATCGACC TCAACGACCT GTTCGGCGAC 
ATCCTGGGCC GCAATCGCGG CGCGGGGGCG GGCGCTGGAG GCTTTGGCGG CGGGTTCTCG 
CCCAAGGGCG CCGACGTGCG GGCCCGCCTC GACATCGACC TGGAAGAGTC GATCAAGGGC 
GGCAAGAAGC GGGTGGCCTT CTCCGACGGC CGCACCATCG ACGTCACCAT CCCGGCCGGC 
GCCCAGGAAG GCCAGACGCT TCGCTTGAAG GGACAAGGCA GCCCGGGCCG GGGCGGGCAG 
GGCGACGCCC TGATCGAGCT GGCGATCAAG CCGCACGCGA TCTATCGCCG TGAGAACGAC 
ACCCTGGTCA TGGACCTGCC GATCTCGGTG CCCGACGCCG TGCTGGGCGG CAAGGTCGAG 
GCCCCCACGC CCGACGGCCC GGTGACCCTG TCGATCCCCA AGGGCTCCAA CAGCGGCGCC 
AGGCTGCGGC TCAAGGGCCG GGGCCTGTCC GACGGCAAGG GCCACCGCGG CGACCTGTTC 
GCCCGGCTGG TGGTGACCCT GCCCGACGCG CCAGACACCG AGCTGGAGGC GTTCGCCGAC 
ACCTGGCGCA AGGACCGGCC GTACGCGCCG AAGCGGCGGT AG

Protein sequence

MARDPYLELG VSRTASAAEI RKAFHKLAKQ HHPDANKGDK KSEERFKQVS AAFDILGDAD 
KRKKFDAGEI DADGRETMRA GGFGGGGSPF GGGFNRSGGF GRGGGAAEGP EIDLNDLFGD 
ILGRNRGAGA GAGGFGGGFS PKGADVRARL DIDLEESIKG GKKRVAFSDG RTIDVTIPAG 
AQEGQTLRLK GQGSPGRGGQ GDALIELAIK PHAIYRREND TLVMDLPISV PDAVLGGKVE 
APTPDGPVTL SIPKGSNSGA RLRLKGRGLS DGKGHRGDLF ARLVVTLPDA PDTELEAFAD 
TWRKDRPYAP KRR