Gene Caul_0427 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0427
Symbol
ID	5897701
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	467441
End bp	468466
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	65%
IMG OID	641560913
Product	xylose isomerase domain-containing protein
Protein accession	YP_001682062
Protein GI	167644399
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1082] Sugar phosphate isomerases/epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACGC TCAAAGGCCC GGCGATCTTT CTGGCCCAGT TCGCCGGCGA CGCCGCGCCG 
TTTGACACGC TTGAGAACCT GGCCGCGTGG GCCGCCGGGC TTGGATACAA GGGTGTTCAG 
GTCCCCACCG ACAATCCGGC GATCTTCGAT CTGACCCTGG CTGGCCAAAG CAAGACCTAT 
TGCGATGAGG TCAAGGGCCG GCTGGCGCAG ATCGGCGTGG AGATCACCGA GCTGTCCACC 
CACCTTCAGG GACAGCTGGT GGCGGTGCAT CCGGCCTATG ACGAGCTGTT CGACGGTTTC 
GCCGCGCCGC AGGTGCGCGG CAAGCCGGTC GAGCGCCAGG CCTGGGCCGT CGAGCAATTG 
AAGTCCGCCG CCCGGGCCAG CGCCCACCTT GGGCTTTCGG CCCACGCCAC CTTCTCCGGC 
GCCCTGGCTT GGCACCTGGT CTATCCCTGG CCGCAGCGGC CGCCCGGCCT GATCGAAGCG 
GCCTTCGAGG AGTTGGCGCG ACGCTGGCGA CCGATCTTGG ACGCCTTCGA TGAGGCCGGC 
GTGGACGTCG CCTACGAGAT CCACCCGGGA GAGGACTTGC ACGACGGGGC GACCTTCGAG 
CGGTTCTTGG CGGCGGTCGA TGACCACCCG CGCGCCAATA TCCTGTTTGA TCCCAGCCAC 
TTCGTTCTGC AGCAGCTGGA CTATCTCGAT TTCATCGACC GCTATCACCC GCGCATCAAG 
GCGTTCCACG CCAAGGACGC GGAGTTTCGG CCCAATGGTC GCAACGGCGT CTATGGCGGC 
TACCAAAACT GGATCGACCG CGCCGGCCGC TTCCGCTCCT TGGGCGATGG CCAGGTCGAT 
TTCAAATCCA TCTTCAGCAA GCTGGCTCAG TACGACTTTG ACGGCTGGGC GGTGCTGGAG 
TGGGAGTGCT GCCTCAAACA TCCCGAGGAC GGCGCCCGAG AAGGCGCGGC CTTCATCCGC 
GACCACATCA TCCGCGTGAC CGACCGAGCC TTCGACGATT TCGCCAAGGT CGTTCCGACC 
CGCTGA

Protein sequence

MKTLKGPAIF LAQFAGDAAP FDTLENLAAW AAGLGYKGVQ VPTDNPAIFD LTLAGQSKTY 
CDEVKGRLAQ IGVEITELST HLQGQLVAVH PAYDELFDGF AAPQVRGKPV ERQAWAVEQL 
KSAARASAHL GLSAHATFSG ALAWHLVYPW PQRPPGLIEA AFEELARRWR PILDAFDEAG 
VDVAYEIHPG EDLHDGATFE RFLAAVDDHP RANILFDPSH FVLQQLDYLD FIDRYHPRIK 
AFHAKDAEFR PNGRNGVYGG YQNWIDRAGR FRSLGDGQVD FKSIFSKLAQ YDFDGWAVLE 
WECCLKHPED GAREGAAFIR DHIIRVTDRA FDDFAKVVPT R