Gene Acid345_3010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3010
Symbol
ID	4071565
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	3568817
End bp	3570013
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	56%
IMG OID	637985029
Product	alcohol dehydrogenase GroES-like protein
Protein accession	YP_592085
Protein GI	94970037
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.609837
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000185041
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAAAGCAG TTTGCTGGAA TGGACGTCAT GACATGCGGG TCGAGACGGT GGACGACCCG 
AAGATTTTGA ACCCTCGCGA TTGCATCATT AAAGTTACGC GCACCGCGAT TTGCGGCTCG 
GACTTGCACC TTTACAACGG CCTTATCCCA ACGATGGAAG CGGGCGATAT TGTGGGGCAT 
GAGTTCATGG GCGAAGTGGT GGAGATTGGG CCGCAGGTGA AGAAGCTGAA AGTTGGAGAC 
CGTGTGGTGA TTCCCTTCAC CATCGCCTGC GGCAATTGTT TCTTTTGCCG ACAGCAGCTT 
TGGTCGTCGT GCGATAACAC CAATCCGAAT GCGTACATTG CAGAAGCGCT GATGGGATAT 
TCGCCGTCGG GATTGTTCGG TTATTCGCAC ATGACTGGCG GCTACGCAGG CGGCCAGGCG 
CAGTACGTGC GCGTACCATT CGCAGATATC GGGCCATTGA AGATCGAAAG TGATCTGACG 
GATGATCAAG TGCTGTTCTT GTCCGATGTC TTCCCTACTG GATACATGGC CGCGGAGAAC 
TGCGACATCC AACCCGGCAA AGGACAAACG GTGGCGGTGT GGGGCTGCGG TCCGGTGGGA 
CTGTTTGCGA TCAAGAGCGC GTTTTTGCTG GGCGCAGAAC AGGTGATCGC GATCGATCGC 
TTCCCGGAGC GTCTGTACCT GGCGGAACAG GCCGGAGCAG AGACACTGAA CTACTCGGAG 
ATTCCTGACC TGATCGAAGT TCTGAAGGAA CTGACTGGCG GTCGCGGACC TGATGCCTGC 
ATTGATGCTG TCGGCATGGA GGCCCATGGC GTTTCGATCG ACGCCCTCGC CGATGAGGTG 
AAGCAGGTGA TGAAGGTCGA GACAGATCGT CCGCTGGCAC TGCGGCAGGC GATCCAAGCG 
TGCCGGAAGG GCGGAGTCGT TTCCGTTCCC GGCGTCTACG GTGGTTTCGT GGATAAGATT 
CCGATGGGTG CGTTCATGAA CAAGGCGCTG ACCATGAAGA CCGGCCAGAC ACACATGATG 
AAGTACATGA AGCCGCTGCT CGAACACATC GAGAAGGGCG ATATTGACCC CAGTTTCATC 
ATTTCGCATC GGGTCACGAT TGATCAGGTA CCAGAGATGT ACGACGTGTG GCTTAAGAAA 
CAGGACCATG TGACGAAGAT CGTGATCGAC CCGTGGGCGG AAAATATCGC GGCGTAA

Protein sequence

MKAVCWNGRH DMRVETVDDP KILNPRDCII KVTRTAICGS DLHLYNGLIP TMEAGDIVGH 
EFMGEVVEIG PQVKKLKVGD RVVIPFTIAC GNCFFCRQQL WSSCDNTNPN AYIAEALMGY 
SPSGLFGYSH MTGGYAGGQA QYVRVPFADI GPLKIESDLT DDQVLFLSDV FPTGYMAAEN 
CDIQPGKGQT VAVWGCGPVG LFAIKSAFLL GAEQVIAIDR FPERLYLAEQ AGAETLNYSE 
IPDLIEVLKE LTGGRGPDAC IDAVGMEAHG VSIDALADEV KQVMKVETDR PLALRQAIQA 
CRKGGVVSVP GVYGGFVDKI PMGAFMNKAL TMKTGQTHMM KYMKPLLEHI EKGDIDPSFI 
ISHRVTIDQV PEMYDVWLKK QDHVTKIVID PWAENIAA