Gene Caul_4609 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4609
Symbol
ID	5902071
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4985312
End bp	4986367
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	69%
IMG OID	641565128
Product	xylose isomerase domain-containing protein
Protein accession	YP_001686227
Protein GI	167648564
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1082] Sugar phosphate isomerases/epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0474989
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGACGC TCAAGGGACC CGGCATCTTC CTGGCCCAGT TCATCGGCGC CGAGCCGCCG 
TTCGACAAGC TGGAGACCAT GGCCGCCTGG GTCGCCGATC TCGGCTATGT CGGGGTGCAG 
ATGCCGACCG GCGGCGCGGA CTCGTTCTTC GACCTGGCCC TGGCCGCCGA GAGCCAGACC 
TATTGCGACG ACATCGCCGG GTTGCTGGCC GGTCATGGCC TGCGGATCAC CGAGCTGTCG 
ACCCACCTGC AGGGTCAGCT GGTCGCCGTG CACCCGGCCT ATGACGAGCT GTTCGACGGC 
TTTGCCCCGC CTGAACTGCG CGGCAGGCCA GTCGAGCGCC AGGTCTGGGC GGTGGGCCAG 
CTGAAGGCCG CGGCCGTCGC CAGCCGGCGG CTCGGGCTGA ACGCCCACGC CACCTTCTCC 
GGCGCCCTGG CCTGGCCGTA CTTCTATCCC TGGCCGCAGC GCCCAGCGGG TCTGATCGAG 
GAGGCGTTCG CCGAACTGGG CCGCCGCTGG AAGCCGATCC TGGACGTCTT CGACAACGAG 
GGCGTCGATG TCTGCTACGA GATCCATCCG GGCGAGGACC TGCACGACGG CGCGACGTTC 
GAGCGGTTCC TCGACGAGGT CGGCGGCCAC GCGCGGGCCA ATATTCTCTA TGATCCCAGC 
CACTTCGTGC TGCAGCAGCT GGACTACCTA GGCTACATCG ACCGCTATCA CGAGCGGATC 
CGCGCCTTCC ACGTCAAGGA CGCCGAGTTT CGGCCGTCGG CCCGGTCGGG CGTCTATGGC 
GGCTACCAAG GCTGGGCCGA GCGACCCGGC CGCTTCCGAT CGCTGGGCGA TGGCCAGGTG 
GACTTCAAGG CGATCTTCTC CAAGCTGGCC CAGTACGACT ATCCCGGCTG GGCGGTGCTG 
GAGTGGGAGT GCGCGCTGAA ACATCCGGAG CAGGGCGCCC GCGAAGGCGC GCCGTTCATC 
CGCGACCACA TCATCCAGGT GACCGACCGG GCGTTCGACG ACTTCGCCGG CAGCGCGCCC 
GACGGCGACC GCAATCGCCG GCTCCTGGGC CTGTAG

Protein sequence

MKTLKGPGIF LAQFIGAEPP FDKLETMAAW VADLGYVGVQ MPTGGADSFF DLALAAESQT 
YCDDIAGLLA GHGLRITELS THLQGQLVAV HPAYDELFDG FAPPELRGRP VERQVWAVGQ 
LKAAAVASRR LGLNAHATFS GALAWPYFYP WPQRPAGLIE EAFAELGRRW KPILDVFDNE 
GVDVCYEIHP GEDLHDGATF ERFLDEVGGH ARANILYDPS HFVLQQLDYL GYIDRYHERI 
RAFHVKDAEF RPSARSGVYG GYQGWAERPG RFRSLGDGQV DFKAIFSKLA QYDYPGWAVL 
EWECALKHPE QGAREGAPFI RDHIIQVTDR AFDDFAGSAP DGDRNRRLLG L