Gene Caul_0422 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0422
Symbol
ID	5897696
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	461924
End bp	462925
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	61%
IMG OID	641560908
Product	xylose isomerase domain-containing protein
Protein accession	YP_001682057
Protein GI	167644394
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1082] Sugar phosphate isomerases/epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGACCA AAAAGGGCCT CAAGCTCGGC ACGACGCTCT ACAGCCTCAC CAACGAGTTT 
CATTGGCGAA AATATGATTT CGAAGGCCTG GTTCGCAGGG TCGCGGCCGA GAACCTTGGG 
CCGGGGCTAG AGGTTGTCGG CTTCCAAAGC ATCAAGGGCT TCCCGGTCAT CACCGACGCC 
TACGCCGAAT GGTTCAAGGC GCTGATCGCC GAGACCGGGC TTGAGCTGTC ATGCCTGGGC 
ATCAACGCTG ACAACGCCAT TCGTCGCGAC CGCGACATGA CGGTCGAGGA GTCGGTGACC 
TATCATCAGG CTCAGATCGA TGCGGCGGCC AAGCTAGGCT TCCCGGTGGC GCGTTACCAA 
TACCCGGCCG GCGTCGAGGT CATCCGCCGC CTAGAGCCCT ATGCGGCCGA AAAAGGCGTC 
AAACTCGGGC TCGAAATCCA TTCGCCCCAC ACCGTCCACA CGCCCGACAT CATGAAATAT 
CGTGAGCTCT ATGACACGCT GAGCTCGCCC TATCTCGGCT TTGTGCCCGA CTTCGGCTCA 
TCGGTGGTGG GCATTCCTCC GATGGTCATC GCCCGTTTCC GTGCGGGCGG CGCGTCCGAG 
ACCCTGATCG ACATCGTTCT GGAGGAGTGG CGTAGCGACG CCCCGGTGAT GGAGAAGCAG 
GCCAGCTTCC GCAGGCGCGG CGAAGCGGCC GGGGCCAATG TGGAGACCCT GAACCGTCTG 
GCCTTTGTCT TCGGCTATTT CAGTCGCCAG GCGCCGCAGG ACTGGGCCGA GATCATGCAC 
CAGGTCGTGC ACATCCACGG CAAGTTCTTC GACTTCAATG ACCAGGGCGA AGAGAACTCC 
GTGCCCTATC CGGAAATCCT CAAGGTCTTC GTTGACGGCG GCTACGACGG CTACATGTCC 
AGCGAGTACG AGGGCCATCT GTTCTCGGAC GACGACGGCT TCGACAAGCT GCTCGCCCAC 
CATGCCCAAT GCCAGCGCAT CCTCGATCGG CTGCAAGCCT AG

Protein sequence

MSTKKGLKLG TTLYSLTNEF HWRKYDFEGL VRRVAAENLG PGLEVVGFQS IKGFPVITDA 
YAEWFKALIA ETGLELSCLG INADNAIRRD RDMTVEESVT YHQAQIDAAA KLGFPVARYQ 
YPAGVEVIRR LEPYAAEKGV KLGLEIHSPH TVHTPDIMKY RELYDTLSSP YLGFVPDFGS 
SVVGIPPMVI ARFRAGGASE TLIDIVLEEW RSDAPVMEKQ ASFRRRGEAA GANVETLNRL 
AFVFGYFSRQ APQDWAEIMH QVVHIHGKFF DFNDQGEENS VPYPEILKVF VDGGYDGYMS 
SEYEGHLFSD DDGFDKLLAH HAQCQRILDR LQA