Gene Gdia_1830 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1830
Symbol
ID	6975252
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	2032976
End bp	2034067
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	69%
IMG OID	643391355
Product	hopanoid-associated sugar epimerase
Protein accession	YP_002276205
Protein GI	209543976
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID	[TIGR03466] hopanoid-associated sugar epimerase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGCCGC ATCGTTTCGC CGCCAACCGG CCGCCCCATG GGGGTTTCCC CCGGGACGTC 
CGCCTGCTGA CATATACCGG AGCATCCGAT CGGATCATGA CTGCCCCCAC GCTTGTTACC 
GGCGCGACCG GTTTTGTCGG TTCGGCCGTT GCCCGTACGC TTCTCCAGCG GGGGCATTCG 
CTGCGCCTGA TGGCGCGCAA GGGGGCGGAC CTGACCAATA TCCGCGACCT GCCGGCGGAA 
CTGGTCGAAG GCGACCTGTC CGCGCCCGCC ACCTTCGCCG ACGCGGTGCG GGGGTGTCGC 
TACGTCTTCC ATGTCGCCGC CGACTATCGG CTGTGGGTGC CCGACCCCGC GCCCATGATG 
ACCGCGAATG TCGAGGGAAC GCGCCGCCTG ATGCTGGCGG CGCAGGACGC GGGGGTGGAA 
CGGATCGTCT ATTGCTCGTC GGTCGCGGCG CTGGGGCTGA TCGGCGACGG CACCGTGTCG 
GACGAGGACA CGCCGGTTCA CGAGCACGCG GTGATCGGGA TCTACAAGCG GTCCAAATAC 
CGGGCGGAGC AGGAGGTCCT GCGCCTGGTC CGCGAACGCG GCCTGCCGGC GGTGATCGTC 
AACCCGTCCA CCCCCGTGGG CCCGCGCGAC ATCAAGCCGA CGCCGACGGG CCAGATGATC 
CTGGATTGCG CGGCGGGGCG CATGCCGGCC TATGTCGATA CCGGGGTGAA CATCGTCCAT 
GTCGACGACG TGGCCGAGGG CCACGTCCTG GCGCTGGAAC GCGGCCGGGC GGGTGAGAAA 
TACATCCTGG GCGGCCAGAA TTTCCTGCTG CGCGACCTGT TCGCCATGAC GGCGGACATC 
GCGGGCGTGC GGCCGCCGCG CGTCAGCCTG CCGCAATCGG TGATCTGGCC GGTGGCGGTG 
GTGTCGGAAT GGCTGTCGCG CGGCTTCGGC ATCGCCCCGC GCGTCACGCG CGAGATGCTG 
GCCATGTCGC ACAAGAAGAT GTTCTTTTCC TCGGCCAAGG CCGAACGGGA GCTGGGCTAT 
GCCCCGCGCC CGGCGCGCGA CGCGGTGGCG GATGCCGTGG CCTGGTTCCG CCAGAACGGC 
ATGCTGGGCT AG

Protein sequence

MVPHRFAANR PPHGGFPRDV RLLTYTGASD RIMTAPTLVT GATGFVGSAV ARTLLQRGHS 
LRLMARKGAD LTNIRDLPAE LVEGDLSAPA TFADAVRGCR YVFHVAADYR LWVPDPAPMM 
TANVEGTRRL MLAAQDAGVE RIVYCSSVAA LGLIGDGTVS DEDTPVHEHA VIGIYKRSKY 
RAEQEVLRLV RERGLPAVIV NPSTPVGPRD IKPTPTGQMI LDCAAGRMPA YVDTGVNIVH 
VDDVAEGHVL ALERGRAGEK YILGGQNFLL RDLFAMTADI AGVRPPRVSL PQSVIWPVAV 
VSEWLSRGFG IAPRVTREML AMSHKKMFFS SAKAERELGY APRPARDAVA DAVAWFRQNG 
MLG