Gene Caul_5280 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5280
Symbol
ID	5897438
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010335
Strand	+
Start bp	221322
End bp	222557
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	66%
IMG OID	641555383
Product	glycoside hydrolase family protein
Protein accession	YP_001676714
Protein GI	167621929
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0160415
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCGACCG ACGCCCGCCG CCCCGTTCCC GAAGGCTTTC TTTGGGGCAC CGCGATTTCA 
GCGCACCAGA GCGAAGGTCA AAACATCAAT TCCGACGCCT GGCTGTGCGA GACGGTCAAA 
CCCAGCGTCT ACGCCCAGCC CTCGCTGGAC GCTTGCGACA GCTATCATCG CTACGCCGAG 
GACATCGCCA TCGCCGCCGG GCTCGGCTTC AACTGCCACC GGATCGGCAT CGAGTGGGCC 
AGGATCGAGC CGGAGTGCGG GGTCTTCTCG CTGGCGGCCC TCGATCACTA CCGTCGTGTT 
CTGGAAGCCT GCCACGCGCG CGGGCTCAAG CCGATGGTCA CCTTCAACCA CTTCACCGTG 
CCGCGCTGGT TCGCCGCCCG GGGCGGCTTT GAGGTCGCCG ACGGGGCCGA CCTCTTCGCC 
CGGTTCGCCG CCAAGGCCAC CGAGCATCTG GGTGATCTGA TCAGCTACGC CACCACCTTC 
AACGAAGCCA ATATCCAGCG TTTGGTGGCG CTGCTGCGCC GCGGCGCCGA CGCTCAAGGT 
CCGATCGACG CGATGATCGC CGCCTGCGCC AAGGCCAGCG GCTCCGAGCG CTTCTCCTCG 
GTCCTGTTCG CGCCCCTGGA GGCTTGCGAA CCTGTGATGC TGGACGCCCA TTTTAAGGCC 
ACGGCGGCCA TGAAGGCTGG CCCGGGCGAC TTTCCTGTCG GCCTGACCCT GTCGATGCAA 
GACGTCCAAG GGCAAGGCGA GGGCCATCTG GCCGAAGCGC TGATCCAGAT GCTCTATGGC 
CCTTGGCTGG ACGCGGCGCG CCAAGCCGAC TTCATCGGCG TGCAAACCTA CACTCGGGTG 
ATCGTCGGCC CACAGGGACG CGTGGCCCCG GCCAAAGACG CCGAAATGAC GGGGGCGGGG 
TATGAATTCT ATCCGCAGGC CCTGGGCGGC ACTATCCGCC TGGCCCATGC GCGGATCGGC 
AAGCCGATCT ACGTCACCGA GAGCGGCATC GCCACCCACG ACGACACCCG TCGCATCGCC 
TATCTGGACC AGGCCCTGGC CGAGATCCGC CAGTGTCTGG ACGACGGCAT CGAGGTCAAA 
AGCTTCATCT GTTGGTCGTT GCTGGACAAC TTCGAATGGA CCCGCGGCTA TGGCGAGCGC 
TTTGGCCTGG TTCACGTCGA CTACGACACC TTCGAGCGCA CCCCCAAGCC CAGCGCCCAT 
CACCTGGGCG CCATCGCTCG CGCGGGCGTG ATCTGA

Protein sequence

MPTDARRPVP EGFLWGTAIS AHQSEGQNIN SDAWLCETVK PSVYAQPSLD ACDSYHRYAE 
DIAIAAGLGF NCHRIGIEWA RIEPECGVFS LAALDHYRRV LEACHARGLK PMVTFNHFTV 
PRWFAARGGF EVADGADLFA RFAAKATEHL GDLISYATTF NEANIQRLVA LLRRGADAQG 
PIDAMIAACA KASGSERFSS VLFAPLEACE PVMLDAHFKA TAAMKAGPGD FPVGLTLSMQ 
DVQGQGEGHL AEALIQMLYG PWLDAARQAD FIGVQTYTRV IVGPQGRVAP AKDAEMTGAG 
YEFYPQALGG TIRLAHARIG KPIYVTESGI ATHDDTRRIA YLDQALAEIR QCLDDGIEVK 
SFICWSLLDN FEWTRGYGER FGLVHVDYDT FERTPKPSAH HLGAIARAGV I