Gene Caul_4916 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4916
Symbol
ID	5902378
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	5311456
End bp	5312616
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	68%
IMG OID	641565436
Product	mannose-6-phosphate isomerase
Protein accession	YP_001686534
Protein GI	167648871
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2942] N-acyl-D-glucosamine 2-epimerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.982675
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCCGCCC AAGATGCCCT CCTCGCCGTA CCGTTCGACG AAATCCGCCG CTGGATGTTC 
GACGAGGCTC TGCCCTTCTG GGCTGAATAC GGGGTCGACC GCGCGGACGG GGGGTTCGTC 
GAACAGCTCG ACTTCGAAGG CCGCGATGTG GGCGTGGACT TCAAGCGCAC CCGCGTCACG 
TGCCGGCAGA TCTACGTCTT CTCCCACGCC GCGGTCCTCG GCTGGGAGCC TGGCAGGGCG 
CTCGCCGACC ACGGTGTGGC GTTCCTCAAG AAAGCGTGGT TGGGGCCCGA CGCCGGCTGG 
GCCCGGTCGC TGACTCGCCA GGGTGACGTC CTGGACGCCA CGCCCGATCT CTACGACATC 
GCCTTCGCCC TCTTCGCCCT GGGGTGGCAC GTTCGCGCCA CCGGTGACGC CGACTCCGCC 
GAACTGGCTC GGCAGACCCT CGACTTCACC GAACGCCACA TGCGCCCTGC CCAGGGTCGC 
GGCTTCCTGC ACGAAAAGCC GGCCAAGGGC TGGCGTCTGC AAAATCCCCA CATGCACCTG 
ATGGAAGCCG CGCTGTCCTG CCTCGAGGCC ACCGGCGACC CGCGCTACGC CGAACTGGCC 
AAGGAGCTGG AGGGCCTTTT CCGCGACAAG CTGTTCGTCC CCCAAAGCCA GACCCTGGCT 
GAGTATTTCG ACGACGACTG GAATCGCGCG CCCAGCGACG ACGGCCGGAT CATCGAGCCC 
GGCCACCAGC TGGAATGGGC CTGGATCCTG GCCAATCTCG AGCGCCTGAC CGGCGCCAAG 
ACCGAGGACC TGGTGCGCGG CCTAACGGAC TTCGCCGAAC GCCACGGCGT GGATCCCGAG 
ACCGGCGTGA CCTACAATCA GGTGCGAGAC GACGGCGTCG CGCTGGATCG CGGATCGCGC 
ACCTGGCCCA ACACCGAGCG GCTGAAGGGC CACGTCGCGC GCTTCGAGCA ATGGGGCGAA 
GACCCGCGCC GGGCCTTGAC CAGCTCAAGC CGCGTGCTGC TTGACCGCTA TCTGGGCTAC 
GGGCTTCCCG CCCTGTGGCT GGACCATTTC GGGCCCGACG GCGAGCATCG CGTGAACTAC 
GCGCCAGCCT CGACGCTGTA TCACGTGTTT CTGGCGTTCG CGGAAGTTCT GCGAATCGAG 
CCGCGCTTGG CCGGGATCTA G

Protein sequence

MPAQDALLAV PFDEIRRWMF DEALPFWAEY GVDRADGGFV EQLDFEGRDV GVDFKRTRVT 
CRQIYVFSHA AVLGWEPGRA LADHGVAFLK KAWLGPDAGW ARSLTRQGDV LDATPDLYDI 
AFALFALGWH VRATGDADSA ELARQTLDFT ERHMRPAQGR GFLHEKPAKG WRLQNPHMHL 
MEAALSCLEA TGDPRYAELA KELEGLFRDK LFVPQSQTLA EYFDDDWNRA PSDDGRIIEP 
GHQLEWAWIL ANLERLTGAK TEDLVRGLTD FAERHGVDPE TGVTYNQVRD DGVALDRGSR 
TWPNTERLKG HVARFEQWGE DPRRALTSSS RVLLDRYLGY GLPALWLDHF GPDGEHRVNY 
APASTLYHVF LAFAEVLRIE PRLAGI