Gene Caul_4611 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4611
Symbol
ID	5902073
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4987506
End bp	4988483
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	67%
IMG OID	641565130
Product	xylose isomerase domain-containing protein
Protein accession	YP_001686229
Protein GI	167648566
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1082] Sugar phosphate isomerases/epimerases
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.805097
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.241232
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCTCAA CAGCTTTTGG AAACTCCACC GCCGGCGTGG GCTTGTCGCG GCGCGGACTG 
TTGGCCGCTG GCGTCGCGGC CCTGGGCGCG GCCCATGGCG GCGTCGCCAG CGCGGCGGCC 
AAGCCGTTCT TCCAGCGCCA CGGCCTGCCG CTCGGCATCC AGCTCTACAC CCTGGGTCCG 
GACCTGCAGA AGGACCTGGA CGCCCAGCTC GCCACGCTGG CCAAGATCGG CTTCAAGTCG 
GTGGAGCTGG CCGGCTATCT GGGCCGCACG CCGGCCGAGC TGCGGGCCGC GTTCGATAAG 
GCGGGCCTGG TTTGCCCCAG TGCCCACATC TCGCCCAAGG GCGCCAATGG CCCCAGCTTC 
AGCGGGGATT TGGCCAAGCT GGCCGACGAG CTCCACGTCA TCGGCGTCAA GTCGGCGATC 
ATGCCGATCC TGTACATCCC CGACCGCCTG GGCGGCGCCG ATCTGCGCCA AGCCGGCGCA 
CAGATGACGG CCGACGACTG GAAGTGGAAC GCTGATTTCC TGAACGAGAA GGCCGCCGTC 
CTCAAGAAGG CTGGCATCGC GACCGGCTAC CACAACCATA ATTTCGAGTT CGCGCCGCTA 
AAGGACACCA ACGGCGGCGA CACCACCGGC ATGGACATCC TGCTGAACGG CACGGACCCG 
AGCCTGGTCG TCTTCGAGAT GGATGTCGGC TGGGTCACGG CGGCGGGGCA TGACCCGTTC 
GCCCTGCTGA AGAAGCATCC CGGCCGCTTC ACCCAGATGC ACGTCAAGGA CATCAAGGCC 
AGCACCAAGA CCAACTTCGT CCTGCAGCAG GATCCGACCG AGGTCGGGAG CGGCATGATC 
GCCTGGCCCA AGCTGTTGCC CGCCGCCTAC GACGCCGGGG TCCGGGGCTT CTATGTCGAA 
CAGGAACCGC CGTTCGCCCA TGGCCGGCTG GACTCCGCCA AGATCAGCTT CGACTACCTG 
GCGAAAGTCA CGGCCTGA

Protein sequence

MRSTAFGNST AGVGLSRRGL LAAGVAALGA AHGGVASAAA KPFFQRHGLP LGIQLYTLGP 
DLQKDLDAQL ATLAKIGFKS VELAGYLGRT PAELRAAFDK AGLVCPSAHI SPKGANGPSF 
SGDLAKLADE LHVIGVKSAI MPILYIPDRL GGADLRQAGA QMTADDWKWN ADFLNEKAAV 
LKKAGIATGY HNHNFEFAPL KDTNGGDTTG MDILLNGTDP SLVVFEMDVG WVTAAGHDPF 
ALLKKHPGRF TQMHVKDIKA STKTNFVLQQ DPTEVGSGMI AWPKLLPAAY DAGVRGFYVE 
QEPPFAHGRL DSAKISFDYL AKVTA