Gene Caul_3241 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3241
Symbol
ID	5900696
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3501445
End bp	3502356
Gene Length	912 bp
Protein Length	303 aa
Translation table	11
GC content	68%
IMG OID	641563746
Product	short-chain dehydrogenase/reductase SDR
Protein accession	YP_001684866
Protein GI	167647203
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.707326
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.647553
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATGC TTGAAAACAA AGTCGTCGCC GTCACGGGGG CGGGCCGGGG CATCGGCAGG 
GCCGTCGCCC TGCTGTGCGC GGCCCAGGGC GCCAAGGTGA TCGTCAACGA TCTGGGCGGC 
GGGGCGGATG GGCAGGGGCG CGACGCCGAC CCTGCCAGTC AGGTGGTCAA GGAAATCCTC 
GCGGCCGGCG GTCAGGCCTA CGCCAACACC GCCAGCGTTT CAGACGCGCA GGGCGCGGCT 
TCGATCATCG AGGATGCGGT CTCCCAATTT GGGCGCATCG ACGCGGTGGT CAACAACGCC 
GGCTTCCTGC GCGACAGCAT CTTCCACAAG ATGGATCAGG CTGACTGGAA CGACGTCATC 
GCCGTGCACC TGACCGGCTG CTTCCAGGTC TCGCGCGCGG CCGCGCCCCA TTTCAAGGCC 
CAGGGCTCGG GCGCGTTCGT GCAGTTCACC TCGACGACCG GCCTGCTGGG AAACCTTGGT 
CAAGCCAACT ACGCGGCCGC CAAGGCCGGC GTGGTGGGCC TGTCGACGGC CATCGCCCTG 
GACATGCGGC GCTTTGGCGT TCGCTCCAAC TGTGTCGCCC CGACCGCGTG GACGCGCCTG 
CTCGACACCG TCCCCGTCGA CAGCGCGGAA AAGCGCGCCG CGATGGCGCG GCTCAAGACC 
CTCACGCCCG AGAAGATCGC GCCCCTGGTG GCCTTCCTTT GTTCGGACCA GGCCGCCGAT 
GTCAGCGGCC AGATCTTCGG CGTACGGGGA AACGAGGTCT TCCTCTATTC GCGGCCGACC 
ATCCTGCGCA CCATGCAGAT GACCGAGGGC TGGACGCCGC AGACCTGCGC CGAGGTGCTG 
ATGCCCGCGC TGCGGCCCAG CTTCCAGCCC CTGTTGACCA CGCCCGAGAT CATTTCGTGG 
GATCCGCAAT GA

Protein sequence

MTMLENKVVA VTGAGRGIGR AVALLCAAQG AKVIVNDLGG GADGQGRDAD PASQVVKEIL 
AAGGQAYANT ASVSDAQGAA SIIEDAVSQF GRIDAVVNNA GFLRDSIFHK MDQADWNDVI 
AVHLTGCFQV SRAAAPHFKA QGSGAFVQFT STTGLLGNLG QANYAAAKAG VVGLSTAIAL 
DMRRFGVRSN CVAPTAWTRL LDTVPVDSAE KRAAMARLKT LTPEKIAPLV AFLCSDQAAD 
VSGQIFGVRG NEVFLYSRPT ILRTMQMTEG WTPQTCAEVL MPALRPSFQP LLTTPEIISW 
DPQ