Gene Caul_2449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2449
Symbol
ID	5899904
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	2671288
End bp	2672283
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	70%
IMG OID	641562940
Product	zinc-binding alcohol dehydrogenase family protein
Protein accession	YP_001684074
Protein GI	167646411
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID	[TIGR02822] zinc-binding alcohol dehydrogenase family protein

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.185569
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGGCGA TGGTTCTGGA GGGCGGCCGG CTGACGCCCG CCCTGCGTCA CACGCCAAGG 
CCCGGCCCGG GCGAAGTCCT GCTCCGCGTG CGGACTTGCG GCGTCTGCCG CACGGATCTT 
CATCTCCTGG AAGGCGATCT TCCTGTTCAG GACGGCGTCA TTCCGGGGCA CGAGATCGTC 
GGCGTCGTGG AGGCGCTCGG GCAGGGCGTC ACGACTCTCG ACCTGGGGCA ACGGGTCGGC 
GTCCCGTGGC TCGGCGGGGC CTGCGGGCGT TGCCGATTCT GTCGCCAGGG CGCGGAAAAC 
CTCTGCGATC ACGCGCGGTT CACCGGCTGG ACGCGCGACG GCGGCTATGC CGAAATGACA 
GTCGCGGATG CGCGTTTCTG CTTCGTCCTG CCCGATGAGC TCGGCGATCT TGAGGCCGCT 
CCGCTGCTGT GCGCCGGTCT GATCGGCTTT CGTGCGTGGC GCAAGGCGAT GGAGGGGCGG 
GTCGTTGATC GACTGGGTCT CTATGGCTTT GGCGCCGCCG CCCACCTCCT GGCCCAACTG 
GCGATCGCCG AGGGGCAAAA AATCTACGCC TTTACCAAGC CGGGTGATCT GGCCGCGCAG 
GATCTGGCGT TGGAACTGGG CTGCCTGTGG GCGGGGGCGT CGGACGTCGC GCCGCCCGAA 
CCGCTGGACG CAGCCATCCT GTTCGCGCCG ATCGGCGCGC TCGTGCCGCT CGCCTTGCGG 
GCGGTCCGCA AGGGCGGCGC CGTGGTGTGC GCGGGAATCC ACATGAGCCA GATCCCGGCC 
CTGGACTATG CCGACCTTTG GGGCGAGCGG ACCCTGGTCT CGGTGGCCAA TCTCACGCGC 
GCCGACGCCC AGGACTATCT GCCGCGCGCC GCCGCCGCGG GCGTTCGCCC GCACGTCAAG 
GTCTACGGTC TGCGGCAGGC CCCTCAGGCG CTCGCCGACT TGCGCGCCGG CGCCTTCACG 
GGGGCGGCTG TGCTGCGGAT CGATCCGCCG CTGTGA

Protein sequence

MLAMVLEGGR LTPALRHTPR PGPGEVLLRV RTCGVCRTDL HLLEGDLPVQ DGVIPGHEIV 
GVVEALGQGV TTLDLGQRVG VPWLGGACGR CRFCRQGAEN LCDHARFTGW TRDGGYAEMT 
VADARFCFVL PDELGDLEAA PLLCAGLIGF RAWRKAMEGR VVDRLGLYGF GAAAHLLAQL 
AIAEGQKIYA FTKPGDLAAQ DLALELGCLW AGASDVAPPE PLDAAILFAP IGALVPLALR 
AVRKGGAVVC AGIHMSQIPA LDYADLWGER TLVSVANLTR ADAQDYLPRA AAAGVRPHVK 
VYGLRQAPQA LADLRAGAFT GAAVLRIDPP L