Gene Caul_0434 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0434
Symbol
ID	5897708
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	476228
End bp	477247
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	66%
IMG OID	641560920
Product	alcohol dehydrogenase
Protein accession	YP_001682069
Protein GI	167644406
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGACAG AGACGATGAA GGCGGTTCGG TTCCACGCAT TCGGCGGACC CGAAGTGCTG 
GTCTATGAGG AGGCCCCAAA GCCAGGGGTG AAAGCCGGCG AGGTGCTTGT CCGTGTCCAT 
GCGGTCGGCC TCAATCCCCC CGATTGGTAC CTGCGCGACG GGTACAAGAT GCTGCCGCCT 
GAGTGGCGAC CGAAGGTCGA CTTTCCTGTC ATCCCGGGAA CGGACATTTC GGGCGTCGTC 
GAGGTGGTCG CCGACGATGT GACGGGCTTT TCAATCGGCG ACGAAGTCTA TTCGATGGTC 
CGCTTCCCCA GCGGTATGGC CGGCGAGAGC AGGGCCTATG CCGAGTACGT CAGCGTGCCG 
GCGTCGGAAC TTGCTTTGAA GCCGGCGGGC GTCGATCACG CGCATGCCGC CGGAGCGCCG 
ATGTCGCTGC TCACCGCGTG GCAGTTCATG ATCGAGCTTG GCCACGACGA ACAGAACCCG 
CTTCAGCCGA ACCGGCACGA GCCGGTGCCT CTGGAGGGCA AGACCGTCCT CGTGAACGGA 
GCCGCGGGCG GCGTCGGGCA CTTCGCGGTG CAGCTCGCCA AGTGGAAGGG CGCGCGCGTG 
ATCGCCGTGG CGTCCGGCAA GAACGAGGCG TTCTTGCGCG ACCTCGGCGC CGACGAGTTC 
ATCGATTACA ACACGACCGT TCCCGAGGAT GTCGTCCGCG ACGTCGATCT CGTGATCGAC 
TCGGTTGGCG GCCCGACCAG TGGCCGTTTC CTGCGCACGC TCAAGCCCGG CGGCGCGCTG 
TTCCCGATCT TCCCCCTGGG CTTCTCCGGC GCCGAGGAGG CAAAGACGCT GGGCGTCACG 
GTGTCGGCAA CCCAGGTCCG ATCGAGCGGC GCGCAGCTGG CTGACGTCGC GCGACTGCTC 
GACGATGGCG CCATCCGCAT CGTGATCGAC AGCGCGTTCC GACTTGCCGA CGCTCGCAAG 
GCGCACGAGC GGGCCGCCGA AGGGCACATC CAGGGCAAGA TCGTGCTCCA TGTCGCGTGA

Protein sequence

MSTETMKAVR FHAFGGPEVL VYEEAPKPGV KAGEVLVRVH AVGLNPPDWY LRDGYKMLPP 
EWRPKVDFPV IPGTDISGVV EVVADDVTGF SIGDEVYSMV RFPSGMAGES RAYAEYVSVP 
ASELALKPAG VDHAHAAGAP MSLLTAWQFM IELGHDEQNP LQPNRHEPVP LEGKTVLVNG 
AAGGVGHFAV QLAKWKGARV IAVASGKNEA FLRDLGADEF IDYNTTVPED VVRDVDLVID 
SVGGPTSGRF LRTLKPGGAL FPIFPLGFSG AEEAKTLGVT VSATQVRSSG AQLADVARLL 
DDGAIRIVID SAFRLADARK AHERAAEGHI QGKIVLHVA