Gene Gdia_0390 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0390
Symbol
ID	6973784
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	428641
End bp	429789
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	66%
IMG OID	643389922
Product	galactonate dehydratase
Protein accession	YP_002274801
Protein GI	209542572
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.100514
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	0.488186
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATCA CGAAGCTGAC GACGTTCCAG GTCCCGCCGC GCTGGCTGTT CCTGAAGATC 
GAGACCGACG AGGGGATCAG CGGCTGGGGT GAGCCGGTGG TCGAGGGCAG GGCCGACACC 
GTTGCCGCCG CCGTGGCCGA ACTGGCGGAC TACCTGGTCG GCAAGGACCC GTTCCGCATC 
GAGGATCACT GGACCGTCCT GTATCGCGGC GGCTTCTACC GGGGCGGCGC GGTGCATATG 
AGCGCCATTG CCGGTATCGA TCAGGCGCTG TGGGACATCA AGGGCCGGGC CTTCGGTGTG 
CCGGTGCACG ATCTGCTGGG CGGGCGCTGC CGCGACCGTA TCCGCGTCTA TTCCTGGATC 
GGCGGCGACC GGCCGGCGGA CACGGCCCAG GCGGTCCGCG CCGTGGTCGA TCGCGGCTTT 
ACCGCGATCA AGATGAATGC GACCGAAGAA CTGCAATATG TCGACAGCCA CGCCAAGGTG 
GACGACGTGA TCGCCCGTGT CGCCGCGATC CGCGAGGAGG CGGGGCCCTA TCTGGGCATC 
GGCGTGGATT TCCACGGCCG CGTGCACAAG CCGATGGCCA AGGTCCTGGC CAGGGAACTG 
GAACCCTACG ACCTGATGTT CATCGAGGAG CCGGTCCTGA GCGAGCATCT GGAAGACCTG 
CCTGAAATCA CCAAGCACAC CTCGATTCCC ATCGCGCTGG GCGAACGCCT GTTTTCGCGC 
TGGGACTTCA AGCGGGTGTT CGAACAGGGG TGCGTGGACA TCATCCAGCC CGACCCGTCG 
CATGCCGGCG GCATCACCGA AACCCGCAAG ATCGCGGCGA TGGCGGAGGC CTATGACGTC 
GCGGTGGCGC TGCACTGCCC GCTGGGGCCG ATCGCGCTGG CGGCGAACCT GCAGCTCGAT 
GCCCTGTGCT ACAATGCGTT CATCCAGGAA CAGAGCCTGG GCATCCACTA CAACAAGACC 
AACGACCTGC TGGACTATCT GGTGGATCCG GATGTCTTCG CCTATCGCGA TGGGCACGTG 
GACATCCCGA CCGGCCCCGG CCTGGGGATC GAGATCAACG AGGACTATGT CCGCGCCCGC 
GCCGCCGAGG GCCATCGCTG GCGCAACCCG GTCTGGCGGC ATCGCGACGG GTCGTTCGCG 
GAATGGTAG

Protein sequence

MKITKLTTFQ VPPRWLFLKI ETDEGISGWG EPVVEGRADT VAAAVAELAD YLVGKDPFRI 
EDHWTVLYRG GFYRGGAVHM SAIAGIDQAL WDIKGRAFGV PVHDLLGGRC RDRIRVYSWI 
GGDRPADTAQ AVRAVVDRGF TAIKMNATEE LQYVDSHAKV DDVIARVAAI REEAGPYLGI 
GVDFHGRVHK PMAKVLAREL EPYDLMFIEE PVLSEHLEDL PEITKHTSIP IALGERLFSR 
WDFKRVFEQG CVDIIQPDPS HAGGITETRK IAAMAEAYDV AVALHCPLGP IALAANLQLD 
ALCYNAFIQE QSLGIHYNKT NDLLDYLVDP DVFAYRDGHV DIPTGPGLGI EINEDYVRAR 
AAEGHRWRNP VWRHRDGSFA EW