Gene Gdia_1094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1094
Symbol
ID	6974497
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	1229127
End bp	1230104
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	69%
IMG OID	643390622
Product	ADP-L-glycero-D-manno-heptose-6-epimerase
Protein accession	YP_002275492
Protein GI	209543263
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID	[TIGR02197] ADP-L-glycero-D-manno-heptose-6-epimerase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0181056
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCATCA TCACCGGCGG GGCCGGCTTC ATCGGATCGT GCCTGCAGGC GGCGCTTCAG 
GCGCGGGGCG AGCAGACGGT CGTCGTCGAC TGGCTGGGCA GCCAGGGCAA GTGGCGCAAC 
ATCGCGCGCC ACCCGCCCGA CCACCTGCTG ACGCCCGAGG CACTGGACGA TTTCCTGGCC 
GGCCGGCCCG CCGTGTCCGC CATCCTGCAT ATGGGCGCGA TCAGCGAGAC GACGGCCTGT 
GACGGCGACC TGGCCTGGCG CACCAATGTC GACCTGTCGG CGCGGCTGTG GGCGTGGTGC 
GCGCGGCATG GCGTGCGCTT CATCTACGCG TCCTCGGCCG CGACCTATGG CGCGGCCGGG 
GACGAATCGT TTTCCGACGA TCCCGCGGGG CTGGAGGCAT TGCGGCCGCT GAACCTGTAC 
GGCTGGTCGA AGCATGTGTT CGACCGGCAG GTCGTGGCCG GCCTGGCCCG CGGCGCGTCG 
TCGCCGCCGC AATGGGCGGG ACTGAAATTC TTCAACGTCT ATGGCCCGAA CGAATATCAC 
AAGGGCCCGA TGGTCTCGGT CGTGAAGGTC AAGTACGACG AGGTCCGCCG GGGCCAGCCG 
GCGCGGCTGT TCCGCTCGGA CGTTCCCGGC CTGGCCGATG GGGCGCAGGC GCGGGATTTC 
ATCTGGGTCG GCGACGTGGT GGACGTGACG CTGTGGCTGC TGGACAGCCC GCATGTCAGC 
GGCCTGTTCA ATTGCGGCAC CGGGGTCGCG CGCAGCTACC TGGACCTGGC CCATGCGGTC 
TGCGACGCCG CCGGCCGGCC GCGCCAGGTC GAATTCGTCG ACATGCCTGA CGCGCTGCGC 
GGCCATTACC AGTCCTATAC CCGCGCCGAC ATGACGCGGC TGCGCCAGGC GGGATATGCC 
CGGCCCTTCA CGTCGCTGGA AGACGGCATC CGTCGCTACG TCCAGGATTA CCTGGCCACC 
GACGACGCCT ACCTGTAA

Protein sequence

MIIITGGAGF IGSCLQAALQ ARGEQTVVVD WLGSQGKWRN IARHPPDHLL TPEALDDFLA 
GRPAVSAILH MGAISETTAC DGDLAWRTNV DLSARLWAWC ARHGVRFIYA SSAATYGAAG 
DESFSDDPAG LEALRPLNLY GWSKHVFDRQ VVAGLARGAS SPPQWAGLKF FNVYGPNEYH 
KGPMVSVVKV KYDEVRRGQP ARLFRSDVPG LADGAQARDF IWVGDVVDVT LWLLDSPHVS 
GLFNCGTGVA RSYLDLAHAV CDAAGRPRQV EFVDMPDALR GHYQSYTRAD MTRLRQAGYA 
RPFTSLEDGI RRYVQDYLAT DDAYL