Gene Gdia_1764 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1764
Symbol
ID	6975185
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	1952345
End bp	1953409
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	67%
IMG OID	643391292
Product	aldo/keto reductase
Protein accession	YP_002276143
Protein GI	209543914
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACTATC GCCAGCTCGG CCGTTCCGGC TTGCGCGTAT CCGTCTTCAC TCTCGGCACG 
ATGACGTTCG GCGGCAAGGG TGCCTTCGCC AAGACGGGCA GCACCGATGT CGCCGGCGCG 
AAGCGGCAGA TCGACATGTG CATCGAAGCC GGCATCAACA TGTTCGATAC CGCCGACGTC 
TATTCCTCCG GCGTGTCCGA GGAAATCCTG GGCGAGGCGC TGAAGGGCCG GGCGGGGGAA 
ATCCTGGTGG GCACCAAGGC GCGCTTTCCC ATGGGCAAGG GACAGAACGA CGCCGGCTCG 
TCCCGCTATC ACCTGATATC GGCGGCGGAA GCCAGCCTGC GCCGCCTCGG CCGCGACCAT 
ATCGACCTGT TCTACCTGCA TGAATGGGAC GGCCAGACCC CGCTGGACGA AACGCTGGAG 
GCGCTGGACA CCCTGACCCG CGCGGGCAAG ATCCGCTATG CCGGCGTGTC CAATTTCTCC 
GCCTGGCACA TCATGAAGGC GCTCAGCACG GCGGAACGCC ATCGCCTGAT CGCCCCGGTG 
TCGCAGCAGA TCTATTATTC GCTGCAGGCG CGCGAGGCCG AATACGAACT CCTGCCGCTC 
GCGCTCGACC AGGGGATCGG CGTGCAGGTC TGGAGCCCGA TGGCCGGAGG CCTGCTGTCC 
GGCAAGCACC GGCGCGGCAA GCCCGAACCC GAGGGCACGC GCCAGCTCGC GCAATGGAAC 
GAACCGCCGG TCTATGACGT GGAAAAGCTC TACGATGTCG TCGAAGTCCT GGTGGCGATC 
GGCGCGGAAC GCGGCGTGTC CGCCGCCCAG GTCGCGCTGG CCTGGGTCGC GCATCGTCCT 
GCGATCACCT CGGTGGTGAT CGGGGCGCGG ACCGACGCGC AACTGGCCGA TAACCTCAAG 
GCGGCGGAAC TCAGCCTGTC GGCCGAGGAA ATGGCCCGGC TGGACGAGGC CAGCGCGCCG 
CCGCTGCTCT ATCCGTACTG GCATCAGGCC AGCACGGCGT CGGACCGCCT GTCGCCGGCC 
GACCTGCTGC TGCTCGGCCC CGCGATCGAC AGGAAGAAGG GCTGA

Protein sequence

MHYRQLGRSG LRVSVFTLGT MTFGGKGAFA KTGSTDVAGA KRQIDMCIEA GINMFDTADV 
YSSGVSEEIL GEALKGRAGE ILVGTKARFP MGKGQNDAGS SRYHLISAAE ASLRRLGRDH 
IDLFYLHEWD GQTPLDETLE ALDTLTRAGK IRYAGVSNFS AWHIMKALST AERHRLIAPV 
SQQIYYSLQA REAEYELLPL ALDQGIGVQV WSPMAGGLLS GKHRRGKPEP EGTRQLAQWN 
EPPVYDVEKL YDVVEVLVAI GAERGVSAAQ VALAWVAHRP AITSVVIGAR TDAQLADNLK 
AAELSLSAEE MARLDEASAP PLLYPYWHQA STASDRLSPA DLLLLGPAID RKKG