Gene Gdia_1049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1049
Symbol
ID	6974446
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	1175814
End bp	1176794
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	62%
IMG OID	643390571
Product	short-chain dehydrogenase/reductase SDR
Protein accession	YP_002275447
Protein GI	209543218
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTCAGA TCTTTGACGC GACGTCGAGG ACCGACGATG TTCTCTCCGG CGTATCCCTG 
AAGGGCAAGC GCGTTCTCGT GACCGGCGTT TCCGCCGGAC TGGGTATTGA AACGGCCCGG 
ACACTGGCAG GTCATGGCGC GCATGTCGTG GGCGCGGCAC GCGATCTTGC AAAAGCGGAA 
CGCGCAACCG ATCAGGTTCG CGTGGCCGCG TCGCAAGGAG GCGGAGCGTT CGAACTCATC 
GCGCTCGACC TTGCGGATCT AGCAAGTGTG CGCGCCTGCG CCGACCGTCT GAATGCGCAA 
GGCACGCCCT TCGACCTGAT CATCGCCAAT GCGGGCGTGA TGGCGACTCC ATTCGGGCAT 
ACCAAGGATG GGTTCGAGAC GCAGTTCGGC ACCAACCATC TGGGACATTT CGTTCTGGTC 
AACCGAATTG CCGGACTACT GCGCGACGGC GCGCGACTGG TCAATGTGTC CTCGGCTGGA 
CATCGCTTCG CCGATGTCGA TCTCGACGAT CCGAATTTCG AGCAGACGCC TTACGTGCCG 
TTCGTGGCTT ATGGACGTTC CAAGACTGCC AATATTCTCT TCGCCGTGGC CTTCGATGCG 
CGGCATCGTG CAAGGGGCAT ACGCGCTACG GCGGTTCACC CGGGTGGGAT CAAGACGGAA 
CTGGCGCGGC ACATGGCACC CGGGGAGATC GAAGCCATGG TGAAGCAGGT CAACGAACAG 
GCTGCTGCCG AGGGCCAGAA GCCGTTCCAG TTCAAGAGCA TTCCGCAGGG GGCTGCAACC 
TCGGTCTGGG CCGGCGTCGT GGCCGAAGCC GACATGGTAG GCGCTCATTA CTGCGAGGAT 
TGCCACGTCA GCGATGTTGT ACCGAACGAC CTGCCGATCA GTCTGGTCAA CGCAGGGGTG 
CGCGCCTACG CTCTCGATCC GGCACACGCC GAAGCCCTGT GGACAAAAAG CGAGGAGATG 
GTCGGCGAAC GCTTCGCCTG A

Protein sequence

MTQIFDATSR TDDVLSGVSL KGKRVLVTGV SAGLGIETAR TLAGHGAHVV GAARDLAKAE 
RATDQVRVAA SQGGGAFELI ALDLADLASV RACADRLNAQ GTPFDLIIAN AGVMATPFGH 
TKDGFETQFG TNHLGHFVLV NRIAGLLRDG ARLVNVSSAG HRFADVDLDD PNFEQTPYVP 
FVAYGRSKTA NILFAVAFDA RHRARGIRAT AVHPGGIKTE LARHMAPGEI EAMVKQVNEQ 
AAAEGQKPFQ FKSIPQGAAT SVWAGVVAEA DMVGAHYCED CHVSDVVPND LPISLVNAGV 
RAYALDPAHA EALWTKSEEM VGERFA