Gene Acid345_1744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1744
Symbol
ID	4072011
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	2116434
End bp	2117471
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	57%
IMG OID	637983752
Product	zinc-binding alcohol dehydrogenase
Protein accession	YP_590819
Protein GI	94968771
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.681848
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCCG CAGTCCTCTA TGGCAAAGAG GATGTTCGCA TCGAAAAGGT GCCGGTTCCG 
AAAGTCGGTG AAGGGGAAAT CCTCGTCAAG GTGCAGGTTG CCCTGACCTG TGGCACCGAC 
GTAAAAGTGT ATCGTCGCGG TTACCATGCC CGGATGATCG TGCCCCCGGC ACTGTTCGGC 
CATGAACTCG CCGGCATTGT GGAAGAGGTT GGGCCCGGAG TAAAGCGCCT GAAAAAAGGA 
ATGCGCGTGG TCGCGCTCAA CTCGGCACCT TGCGGGGTCT GCTTTTACTG CTCCAAGCAC 
CAGGAAAATC TTTGTGAAGA CCTGCTCTTC AATAACGGCG CTTATGCCGA GTACATTCTG 
ATTCCGAAAC GCATCGTCGA GAAGAACCTG CTCGTGATTC CGGATGGCGT TAGCTTCGAC 
GAAGCTGCCG TCATCGAGCC GCTGGCCTGC GTGCTGCGCG GCCTGCATGA AACCGGTATG 
GAAGTCGGCG ACACCATTAC CGTCATCGGC GCTGGTCCGA TCGGCCTGAT GTTCGTGAAG 
GCAGCCTCGA TCTCTGGCTG CAAAGTGATT TCCGTTGTAA AGCACGACGA GCAAGTGGAA 
GCCGCCAAGA AAATGGGCGC GCACAAAGTT GTGCAGATCA CGAAGGTGGA CGATCCAGTG 
AAGGCGGTCA TCGAGCTGAC ACCGGAGCAT CGTGGCTCCG ACATTGTGAT TGAAGCGGTT 
GGGCGACCGG ATGCGTGGGA GTGGACGATT GATATGGTTC GCAAGGGCGG CACCGTGAAT 
TTCTTCGGTG GCTGCGCCAA AGGAACCAAA GTCAACCTGA ACACCGAGCG CCTGCACTAT 
TCGGAGATCA CGCTGAAGGC CACGTTCCAT CACACCCCGG AAACAGTGCG CAAGGCGTTC 
GCGTTGATCG CAGAGCGCAA GATCAAAGGC TCCGATTACA TTACCGGGGA AGCGCCATTG 
TCGCGCCTGA CACAGGTGTT CAAGATGATG ATTGAGCGCG GCGGCGAGAT CAAGACCGCG 
ATCATCCCAG GACACTGA

Protein sequence

MTAAVLYGKE DVRIEKVPVP KVGEGEILVK VQVALTCGTD VKVYRRGYHA RMIVPPALFG 
HELAGIVEEV GPGVKRLKKG MRVVALNSAP CGVCFYCSKH QENLCEDLLF NNGAYAEYIL 
IPKRIVEKNL LVIPDGVSFD EAAVIEPLAC VLRGLHETGM EVGDTITVIG AGPIGLMFVK 
AASISGCKVI SVVKHDEQVE AAKKMGAHKV VQITKVDDPV KAVIELTPEH RGSDIVIEAV 
GRPDAWEWTI DMVRKGGTVN FFGGCAKGTK VNLNTERLHY SEITLKATFH HTPETVRKAF 
ALIAERKIKG SDYITGEAPL SRLTQVFKMM IERGGEIKTA IIPGH