Gene Caul_3781 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3781
Symbol
ID	5901243
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	4098346
End bp	4099539
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	71%
IMG OID	641564304
Product	iron-containing alcohol dehydrogenase
Protein accession	YP_001685406
Protein GI	167647743
COG category	[C] Energy production and conversion
COG ID	[COG1454] Alcohol dehydrogenase, class IV
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0115621
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCATC TGGACATGAG GGAAAGCGGC GTGATGGGGG CGGGAGAGCA AAGGCTGATC 
AGCATGGTGA ACGTGGGAAC GCTCACGTTC GGACCGGGAG CGCTTGCGCG CTGCGCTGTC 
GACCTGCTCG CCCGGCGGGC GCGATCGGTC TTTATCGTGA CCACCGAGCC GACGCTCTTC 
CTGTGCGCAC CCCTGGTCGA TGCGCTGGAG GCGGCGGGCG TGACCGTCAC CCTCTGGCAC 
GACCTAGTCG GCGAACCGAC GTTGACGGAA TTCGCCGCCG CGCTGGAGGC GACGCGCGCC 
TGCCAGGCCG ACGCTGTGGT GGGCCTGGGC GGCGGCAGCG CGATGGACGT CGCCAAGCTG 
GTCGCCGCGC TCGCCGACGG CAAGCAACGC ATCACCGAGG TGCTGGGCAC GGACCTGCTG 
GCGGGCCGCG CCCTGTGGCT GGCGTGCATC CCGACCACGG CGGGCACCGG CAGCGAGGTG 
ACGCCGATCG CCATTCTCGG CGACGAGGAC GAGGATCTGA AGAAGGGCGT CGTCAGCCCC 
CATCTGGTGC CCGACGCGGC CTATCTGGAT CCGGCCCTGA CCGTAACCAT GCCACCCTCG 
GTGACGGCGG CGACCGGCCT GGACGCCCTG ACCCACTGCA TCGAGGCCTA CGCCAATCGC 
TTCGCCCATC CGCTGGTCGA CGTCTATGCC CTGGGCGGCA TCCGGCTGAT CGCCGAGAAC 
CTCGAGCGCG CCTGCACGCA CGGCGACGAT CTGGCCGCGC GCTCGGCGAT GATGATCGCC 
AGCTATTACG GCGGCCTGTG CCTGGGGCCG GTCAACACCG CGGCCGTCCA CGCCCTGGCC 
TATCCGCTGG GCGGCGAGTT CCACATCGCC CACGGCGTGG CCAACGCCCT GCTGCTGCCG 
CACGTGCTGC GCTTCAACAT CGAGACGACG CCGGAACGCT ACGCCGCCAT CGCGCGGGCG 
CTGGGCGCCG ACTGCACCGG CGACCATGCG GCCGACGCCC TGGCCGGCGT GGAACGCGTG 
ATCGCCCTGG CCGACGCCTG CGGGATCAAG CGGCGCCTGT CGGACTTTGG CATCGAACGC 
CACGCGATTC CGCGGATGGC GACGGCGGCG ATGAAGGTCA CCCGCCTGCT CGACCGCAAT 
CCCCGCACGC TGACCGAGGC CGACGCCCGC GCGATCTACG AAGCGGCCTG GTAG

Protein sequence

MAHLDMRESG VMGAGEQRLI SMVNVGTLTF GPGALARCAV DLLARRARSV FIVTTEPTLF 
LCAPLVDALE AAGVTVTLWH DLVGEPTLTE FAAALEATRA CQADAVVGLG GGSAMDVAKL 
VAALADGKQR ITEVLGTDLL AGRALWLACI PTTAGTGSEV TPIAILGDED EDLKKGVVSP 
HLVPDAAYLD PALTVTMPPS VTAATGLDAL THCIEAYANR FAHPLVDVYA LGGIRLIAEN 
LERACTHGDD LAARSAMMIA SYYGGLCLGP VNTAAVHALA YPLGGEFHIA HGVANALLLP 
HVLRFNIETT PERYAAIARA LGADCTGDHA ADALAGVERV IALADACGIK RRLSDFGIER 
HAIPRMATAA MKVTRLLDRN PRTLTEADAR AIYEAAW