Gene Caul_4616 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4616
Symbol
ID	5902078
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4993150
End bp	4994145
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	70%
IMG OID	641565135
Product	aldo/keto reductase
Protein accession	YP_001686234
Protein GI	167648571
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.432431
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGACCC GTCAACTCGG CAAGACAGGC CCCGTCGTTT CCGCCCTCGG CCTGGGCGCC 
ATGGGCATGT CGGGCCTGTA CGGCCCCTCC GACCGGGCCG AGAGCCTGGC CACCATCGAC 
GCCGCCCTCG AGGCCGGGAT CACCCTGATC GACACCGGCG ACTTCTATGG CATGGGTCAC 
AACGAGATGC TGATCGGCGA GGCCTTGAAG GGCGCCAAGC GCGACAAGGC GATCCTCAGC 
GTCAAGTTCG GCGCCCAGCG CGATCCGGCC GGCGGCTGGA TCGGCTTCGA CGGCCGGCCA 
GCGGCGGTGA AGACCGCCCT GGCCTACACG CTGCAGCGCC TGGGCGTCGA CCACATCGAC 
ATCTATCGCC CGGCTCGCCT CGACGCCGCC GTGCCGATCG AGGACACGGT CGGCGCCATC 
GCCGATATGG TCCAGGCCGG CTATGTCCGC CACATCGGCC TGTCGGAGGT GGGCGCCGAG 
ACGATCCGCA AGGCCGCCGC CGTCCATCCG ATCGCCGACC TGCAGATCGA ATATTCGCTG 
ATCTCGCGCG GCCTGGAGGA CAGGATCCTG CCGGTGCTGC GCGAGTTGGG CATCGGCATG 
ACCGCCTATG GCGTGCTGTC GCGGGGTCTG ATCAGCGGCC ACTGGGACAG GACCCAGGGC 
CAGGACAAGG GCGACTACCG CGCCCACTCG CCGCGCTTCC AGGGGGACAA TGTCGACAAG 
AACCTGGCCC TGGTCGAGGC GCTGAAGACC GTCGCCCAGG CCAAGGGCGT CAGCGTCGCC 
CAGATCGCCA TCGCCTGGGT CGCCGCCCAG GGCGACGACA TCGTGCCGTT GGTCGGAGCC 
CGCACCCGCG CCCGCCTGGT CGAGTCGCTG GGCGCCCTCG ACGTCACCTT GGCGGCCGAC 
GACCTGGCCG CCATCGAACG GGCCGTGCCC AAGGACGCGG CGGCGGGCGC GCGCTACGCC 
GAAGTCCAGA TGGCGCACCT CGACAGCGAG CGCTGA

Protein sequence

MQTRQLGKTG PVVSALGLGA MGMSGLYGPS DRAESLATID AALEAGITLI DTGDFYGMGH 
NEMLIGEALK GAKRDKAILS VKFGAQRDPA GGWIGFDGRP AAVKTALAYT LQRLGVDHID 
IYRPARLDAA VPIEDTVGAI ADMVQAGYVR HIGLSEVGAE TIRKAAAVHP IADLQIEYSL 
ISRGLEDRIL PVLRELGIGM TAYGVLSRGL ISGHWDRTQG QDKGDYRAHS PRFQGDNVDK 
NLALVEALKT VAQAKGVSVA QIAIAWVAAQ GDDIVPLVGA RTRARLVESL GALDVTLAAD 
DLAAIERAVP KDAAAGARYA EVQMAHLDSE R