Gene Gdia_1425 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1425
Symbol
ID	6974834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	1586858
End bp	1587988
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	71%
IMG OID	643390956
Product	putative L-sorbosone dehydrogenase
Protein accession	YP_002275820
Protein GI	209543591
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGTTCC GCCGGACCAT GTCGATGCTT GTCCTTCTCG GGGCGATGCT GGCCGCCGCC 
GGGACACGGG CCGCGCCGCC GGTCGCGCGG CTGCGCCTGC CGCCGGGATT CCATGTCTCG 
GTCTATACCG ACCAGGTTCC TTCGGCGCGG GAGATGGCGA TCGGCGCCCG GGGCACGCTG 
TTCGTGGGCT CGATGACGGC GGGCGCGGTC TATGCCGTGA CCGATGACGG GCCGGGACGG 
GGCCGCCGGG TGCGGGTCGT GGCGCGCGGG CTGACCATGC CGGTGGGCGT GGCCTTCCGG 
GATGGCGACC TGTACATCTC CGACGTGCGC GACATCGTGG TCCTGCGCGG GATCGAGGAC 
CGGCTGGACC ACCCGCCCGC GCCGCAGGTC GCCGTGCCGG ACCTGCCCTG GCGGGTGGGC 
GACCATGGCT GGAAATTCAT CGCTTTCGGC CCGGACAGCA AGCTGTATGT GCCGATCGGC 
GCGCCGTGCA ATATCTGCGA CGTCGGGCAC CGGTTCGGCC GGCTGATGCG CATGAATCCC 
GACGGCACGG GGCGCGAGGA CGTGGCCTAC GGCCTGCGCA ACAGCGTGGG CTTCACGTGG 
CAGCCGGGCC AACCGGGGCA GCCGGGGGCC GGCACGCTGT GGTTCACCGA TAACGGACGC 
GACCTGATGG GCGACGACGT GCCCAGCGAC GAGCTGAACC GGGTGGACCA TGCCGGCCAG 
TCCTTCGGCT ATCCCTATTG TCATCAGGGC GACGTGCCGG ACCCCGTCTT CGGGCGGGGC 
CATCCGTGTT CCGACTTCAC GCCGCCGGTG CTCAAGCTGG GCGCGCATGT CGCGGCCCTG 
GGCCTGCGCT TCTATACCGG CAGCCAGTTT CCCGCGGCGT GGCGCGGCGC CCTGCTGATC 
GCCGAACACG GGTCGTGGAA TCGCAGCCGG CTGGCGGGTT ATCGCGTCAT GGCGGTGCGC 
TTCGGCCCGG ATGGGGGTAT CGCGTCCTAT GTGCCGCTGA TCGACGGGTT CCAGCAGGAT 
GAAACCCCGT GGGGCCGCCC CGCCGACGTG CAGCCCCTGC CGGACGGCAG CGTGCTGGTC 
AGCGACGACC TGGCCGGCGC GATCTATCGC GTGACCTATG GCAGGGACTG A

Protein sequence

MPFRRTMSML VLLGAMLAAA GTRAAPPVAR LRLPPGFHVS VYTDQVPSAR EMAIGARGTL 
FVGSMTAGAV YAVTDDGPGR GRRVRVVARG LTMPVGVAFR DGDLYISDVR DIVVLRGIED 
RLDHPPAPQV AVPDLPWRVG DHGWKFIAFG PDSKLYVPIG APCNICDVGH RFGRLMRMNP 
DGTGREDVAY GLRNSVGFTW QPGQPGQPGA GTLWFTDNGR DLMGDDVPSD ELNRVDHAGQ 
SFGYPYCHQG DVPDPVFGRG HPCSDFTPPV LKLGAHVAAL GLRFYTGSQF PAAWRGALLI 
AEHGSWNRSR LAGYRVMAVR FGPDGGIASY VPLIDGFQQD ETPWGRPADV QPLPDGSVLV 
SDDLAGAIYR VTYGRD