Gene Acid345_3044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3044
Symbol
ID	4071951
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	3615673
End bp	3616689
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	59%
IMG OID	637985063
Product	alcohol dehydrogenase GroES-like protein
Protein accession	YP_592119
Protein GI	94970071
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.165067
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAAGA TGCGTGCTGT TCAAATTGCT GCGGCCCATG GCGCATTCGA ACTTGTCGAA 
CGTGATATCC CTCAACCCGG TGCCCGCGAA GTGCGAATCA AAGTGCAGGC TTGCGGCGTC 
TGCCATAGCG ATTCAGTCGT AAAAGAAGGC ATCATGCCGA CCAGCTATCC GCGCGTTCCC 
GGCCACGAAG TTGTGGGCGT GATTGATGCC CTCGGCAAAG ACGTGCCGCG CTGGAAGGTT 
GGCGACCGAG TTGGCGTTGG CTGGAATGGC GGCTACTGCG GCTATTGCGA CAACTGTCGT 
CGTGGCGATT TCTTCGCCTG CACTTCGGGC CCGTTCATCA CCGGACTGAC CTCAGATGGC 
GGTTACGCGG ACTACATGAT CGCCCGCCCC GAAGCGCTTG CCCTCGTGCC CACAGATCTC 
TCACCGGAAG ACGCTGCCCC TCTGATGTGT GCTGGCGTCA CCACCTACAA CTGCTTGCGC 
AACAGCGGCG CCATACCGGG TGATCTCGTC GCTGTCCTCG GCATCGGCGG GCTCGGCCAT 
CTCGCGGTGC AGTACGCAGC GAAATCTGGC TATCGCACCG CGGCCATCGC GCGCGGTGCC 
GACAAAGCTG CGCTCGCGAA ACAACTCGGT GCGCATCATT ACATCGACAC CGAGAAAGAA 
GATCCGTCTA AGGCTTTGCA AACGCTCGGC GGCGCGAAGG TGATCCTCTC CACTGTTACC 
GCAGCCGATG CTATGGAAGC GACTCTCGGC GGACTCGCCA TTCGCGGCAA GTTCTTCCTG 
ATTGGCGCAG TGCCCTCGAT GAAGATCAAT CCACTCCAGA TGCTCACGTT CCGCCAGGGC 
GTGGAAGGTT GGTATTCGGG AACGTCGATT GATTCGCAGG ACACGCTGAA CTTCAGCGTG 
CTCGAGAACG TCCGGTCAAT GAATGAGGTC TATCCGCTGG AGAAAGCCGC CGAAGGCTAT 
GAGCGAATGC TGAGCGGCAA AGCGCGTTTC CGCGTCGTGC TAAAAACAGG AAATTAA

Protein sequence

MAKMRAVQIA AAHGAFELVE RDIPQPGARE VRIKVQACGV CHSDSVVKEG IMPTSYPRVP 
GHEVVGVIDA LGKDVPRWKV GDRVGVGWNG GYCGYCDNCR RGDFFACTSG PFITGLTSDG 
GYADYMIARP EALALVPTDL SPEDAAPLMC AGVTTYNCLR NSGAIPGDLV AVLGIGGLGH 
LAVQYAAKSG YRTAAIARGA DKAALAKQLG AHHYIDTEKE DPSKALQTLG GAKVILSTVT 
AADAMEATLG GLAIRGKFFL IGAVPSMKIN PLQMLTFRQG VEGWYSGTSI DSQDTLNFSV 
LENVRSMNEV YPLEKAAEGY ERMLSGKARF RVVLKTGN