Gene Caul_1040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1040
Symbol
ID	5898495
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	1099968
End bp	1101290
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	69%
IMG OID	641561522
Product	mannanase, putative
Protein accession	YP_001682668
Protein GI	167645005
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3934] Endo-beta-mannanase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.41477
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGTCGA GACGTCACCT GATAGCGACC GGCGCGGCCG CCATGGCCGC GGGCGGAGCC 
CACGCCGCCC CGCCCTCGCG GGACTTCGTC ACCGTCCACG AGGGCCGCCT GGCCCTGAAC 
GGCAAGCCCT ATCGCTTCGT CGGCGCGAAC GTCTGGTACG GGGCCTGGCT GGGCTCGCCA 
GGGGCGACGG GCGACGTCGC GCGGCTGGGG CGCGAGCTGG ACCGGCTGAA GGCCCTGGGC 
GTCACCAACC TGCGAGTCCT GGGTTCGGGC GAGAAGTCGC CGGCCAAGGT GGCCATCGAC 
CCCACCTTCC GCGGGCCGGG CCAGGACTAT AACCAGGACC TGCTCAAGGG CCTGGACGTG 
CTGCTGGCCC AGATGGCCAA GCGCGACATG AAGGCAGTGA TCTACGTCAA CAACTTCTGG 
GACTGGTCGG GCGGCATGCC GGCCTATCTG CGTTGGACCG GCAATGGCGA GTGGTTCCAG 
CAGGGCGACC CCGCCCACCC CTGGCCGCAG TTCGCCGACT ATTCGGCCCG CTTCTATGGC 
GACGCCAAGG CCCAGGCGCT GTTCCGTCAC TATGTCCGCG CCCTGGTCAC CCGCACCAGC 
AGCGTCACCG GCAAGCCCTA TCGCGACGAT CCGACGATCA TGGCCTGGCA ACTGGCCAAC 
GAACCCCGCC CCGGCGGCAG CGACGCCTTC GGGGTTCCCA ACCTGCCGAC CTATTACCGC 
TGGATCGCCG AGACCTCGGC CTTCATCAAG ACGCTGGATC CGCACCACCT GGTCACCACC 
GGCAGCGAGG GCGCCATGGG CTGTCTGCGG CGCGAGGCCT GCGTCGTCGA GGCCCACAAG 
CCGGCCAGCA TCGACTACAT CACCCTGCAC GTCTGGCCCA ACAACTGGGG CTGGATCGAC 
CCCAAGAACC AGACCGCCAC CTACGAGGCC GGCGAGGCCC GCTGCCGCGA CTATGTCGTC 
GACCACATCG CCATCGCCCG CCAATTGGGA AAGCCGCTGG TGATCGAGGA GTTCGGCCTG 
GTGCGCGACG GCCGCACGTT CGAGCCGGGC GGCCCCACGG TCTATCGCGA CCGGTTCTAT 
TCCCGGATCT ACGCCCTGGC CCTGGCCGAC ATGCAGGTCG ACGGCCCGAT CGCCGGGACC 
AACTTCTGGG CCTGGAACGG CGAAGGCCGC GCCCAGCACG ACGACGCCTG GTTCAAGATG 
GGCGACAAGG CCTATGCCGG CGACCCGCCG CAGGAGGAGC AGGGCCTGTT TGGGGTGTTC 
GACGCGGATG TATCGACGCT GAACGTGGTG CGGGAGCATG CGAAGGCGGT GGCGGCGCTT 
TAG

Protein sequence

MLSRRHLIAT GAAAMAAGGA HAAPPSRDFV TVHEGRLALN GKPYRFVGAN VWYGAWLGSP 
GATGDVARLG RELDRLKALG VTNLRVLGSG EKSPAKVAID PTFRGPGQDY NQDLLKGLDV 
LLAQMAKRDM KAVIYVNNFW DWSGGMPAYL RWTGNGEWFQ QGDPAHPWPQ FADYSARFYG 
DAKAQALFRH YVRALVTRTS SVTGKPYRDD PTIMAWQLAN EPRPGGSDAF GVPNLPTYYR 
WIAETSAFIK TLDPHHLVTT GSEGAMGCLR REACVVEAHK PASIDYITLH VWPNNWGWID 
PKNQTATYEA GEARCRDYVV DHIAIARQLG KPLVIEEFGL VRDGRTFEPG GPTVYRDRFY 
SRIYALALAD MQVDGPIAGT NFWAWNGEGR AQHDDAWFKM GDKAYAGDPP QEEQGLFGVF 
DADVSTLNVV REHAKAVAAL