Gene Gdia_1118 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1118
Symbol
ID	6974522
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	1255759
End bp	1256748
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	71%
IMG OID	643390647
Product	zinc-binding alcohol dehydrogenase family protein
Protein accession	YP_002275516
Protein GI	209543287
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID	[TIGR02822] zinc-binding alcohol dehydrogenase family protein

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	0.439125
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCACG CGATGCGATT GAATGCCCCG CATACCGACC TGGAATGGGT GGAACTGCCC 
GACCGCCTGC CCGGCCCCGG CGAGATCCGG GTGCGCGTCG GGGCCTGCGG CGTGTGCCGC 
ACCGACCTGC ACGTGGTGGA TGGCGACCTG CCCTTTCCCG GCCATCCGGT CATTCCGGGG 
CACGAGATCG TGGGCCGGAT CGAGGCGCTG GGCGAGGGTG TGCAGGACCT GAAGATCGGC 
CAGCGGGTCG GCGTGCCGTG GCTGGGCCAT ACCTGCGGCA TCTGCCGCTA CTGCCACAGC 
GGGCATGAAA ACCTGTGCGA CCATCCGCTT TTCACCGGCT ACACCCGCGA CGGCGGCTAT 
GCCACCGCCG CCATCGCCGA TGCCCGCTAT GCGTTTCCGC TGGGCGAGGA AGGCAGCGAC 
GTGGACCTGG CCCCCCTGCT GTGCGCGGGG CTGATCGGCT GGCGGTCGCT GGTGATGGCG 
GGCGAGGACG CGAAGACGGT GGGGCTGTAC GGCTTCGGCG CCGCCGCGCA CATCATCGCC 
CAGGTGGCGC TGTGGCAGGG CCGCACCGTC TATGGCTTCA CCCGCCCGGG CGACCGCCCG 
ACGCAGGATT TCGCCCGGTC GCTGGGCGCG ACCTGGGCCG GCGGATCGGA CGAGGCGCCG 
CCGGAGAAGC TGGACGCCGC CATCATCTTC GCCCCCGTGG GCGCGCTGGT TCCGGCGGCC 
CTGCGCGCGG TGCGCAAGGG CGGCCGCGTG GTCTGTGCCG GTATCCACAT GAGCGACATC 
CCCAGCTTCC CCTACGATTT GTTTTGGGAG GAACGGCAAC TGGTTTCGGT CGCCAACCTG 
ACACGGCAGG ACGGTATCGA TTTCCTCTCG CTGGCGCCCA GGATCGGCGT CCGCACCAAG 
ACGACGCGCT ATGACCTGCG CGATGCCAAC CGCGCGCTGG CCGACCTGCG GGCCGGACGG 
TTCGAGGGCG CGGCGGTGCT GGTGCCCTGA

Protein sequence

MMHAMRLNAP HTDLEWVELP DRLPGPGEIR VRVGACGVCR TDLHVVDGDL PFPGHPVIPG 
HEIVGRIEAL GEGVQDLKIG QRVGVPWLGH TCGICRYCHS GHENLCDHPL FTGYTRDGGY 
ATAAIADARY AFPLGEEGSD VDLAPLLCAG LIGWRSLVMA GEDAKTVGLY GFGAAAHIIA 
QVALWQGRTV YGFTRPGDRP TQDFARSLGA TWAGGSDEAP PEKLDAAIIF APVGALVPAA 
LRAVRKGGRV VCAGIHMSDI PSFPYDLFWE ERQLVSVANL TRQDGIDFLS LAPRIGVRTK 
TTRYDLRDAN RALADLRAGR FEGAAVLVP