Gene Caul_4011 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4011
Symbol
ID	5901473
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4342373
End bp	4343269
Gene Length	897 bp
Protein Length	298 aa
Translation table	11
GC content	72%
IMG OID	641564532
Product	short-chain dehydrogenase/reductase SDR
Protein accession	YP_001685634
Protein GI	167647971
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0205558
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCTGC TGGATGGACA TGTCGCGATC GTCACGGGGG CGGGCGGGGG ACTGGGCCGC 
GCCCATGCGC TCTATCTCGC CAGCCAGGGC GCGCGGGTGG TGGTCAACGA CCTGACCCAG 
GACGCGGCCG ACCGCGTGGC CGCCGAGATC ACGGCGCGCG GGGGCCAGGC GATCGGCGTC 
GCGGCCTCGG TCACCGACGA GGCGGCGGTC GGCGCGATGG TCCGCCAGGT CATCGACCGC 
TGGCGGCGGA TCGACATCCT GGTCAGCAAC GCCGGCATCC TGCGCGACAA GAGCTTCGCC 
AAGATGAGCC TGGACGACTT CCGCCTGGTG GTCGACGTCC ACCTGATGGG CGCGGTGGTC 
TGCGCCAAGG CGGTGTGGGA CGTCATGCGC GAGCAGCGCT ACGGCCGCAT CGTGATGACG 
ACCTCCTCGT CGGGCCTCTA CGGCAATTTC GGCCAGGCCA ACTACGGCGC GGCCAAGATG 
GCCCTGGTGG GGCTGATGCA GACCCTGGCC ATCGAGGGCG AGAAGTACGG CGTTCGCGTC 
AACTGCCTGG CTCCCACGGC GGCGACCGGC ATGACCGAGG GCGTGTTGTC GCAGGCCAGT 
CTCGAACGCC TCGATCCCAC CCTGGTCAGC CCGGGCCTGC TGGCCCTGGT GGTCGAGGGC 
GCCCCGACCC GGGCCATCCT GTGCGCCGGC GCCGGCCACT TCGCCACCGC CAACATCACC 
TTGACCGAAG GCCGCTATGT CGGCGACGCT CCCGACGCGG GCGAGCAGGT GATCCGCCAA 
TGGGAGGCGG TTTCCGAGCG GGCCGGCGAG ATCGTCCCGG CCTACGGTTT CGCCCAGGCC 
GAGCGCGAGC TGGCCAGCGC CGGCCTGATC GCCGCCGTCG CCGCGGAGCG GGCGTGA

Protein sequence

MLLLDGHVAI VTGAGGGLGR AHALYLASQG ARVVVNDLTQ DAADRVAAEI TARGGQAIGV 
AASVTDEAAV GAMVRQVIDR WRRIDILVSN AGILRDKSFA KMSLDDFRLV VDVHLMGAVV 
CAKAVWDVMR EQRYGRIVMT TSSSGLYGNF GQANYGAAKM ALVGLMQTLA IEGEKYGVRV 
NCLAPTAATG MTEGVLSQAS LERLDPTLVS PGLLALVVEG APTRAILCAG AGHFATANIT 
LTEGRYVGDA PDAGEQVIRQ WEAVSERAGE IVPAYGFAQA ERELASAGLI AAVAAERA