Gene Gdia_1829 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1829
Symbol
ID	6975251
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	2031766
End bp	2032962
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	71%
IMG OID	643391354
Product	hopene-associated glycosyltransferase HpnB
Protein accession	YP_002276204
Protein GI	209543975
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID	[TIGR03469] hopene-associated glycosyltransferase HpnB

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCCTGC TGGCCGTCTC GCTGCTGTGT GCCGCGATCT GGATCGTGCT GATCGGTTTC 
CATGGACGCT TCTGGCAGGG CGGGCCGATC CTGGCCCCGG CCCGGCCCTC CGCCGGCATG 
GCGGGGCAGG GGGAATGGCC GGCGGTCTGC ATCGTCGTTC CCGCCCGGGA CGAGGCCGAA 
TCGGTGCAGG CCTGCGTCGC CTCGCTGATC GGCCAGGATT ATCCGGGGGC GCTGCACCTG 
ATCCTGGTGG ACGACAACAG CACCGACGGC ACCGGCGCGC TGGCGCGTGC GGTGCCCGAC 
CCCCTGGCGC GGCTGACGGT GATCACCGGC CGGGAGCGCC CCCCGGGATG GAGCGGCAAG 
CTCTGGGCCG TGTCCCAGGG CGTGGCCGAG GCCCGGCGCC AGGTGCCGGA GGATGTCGGG 
TACGTATTCC TGACCGATGC CGACATCACC CATGACCCGG CCCATGTCGC CACCCTGGTG 
GCCAAGGCCG AGGGGGACGG GCTGGACATG GTGTCGGAAA TGGTGGAACT GAACGTCGCC 
AGCGTGGCCG AACACATGCT GGTGCCGGCC TTCGTCTTCT TCTTCGCGCT GCTGTATCCG 
TTCGCGCGGG TCAACGATCC GCGCAGCCGC GTCGCCGGGG CCGCGGGCGG GTCGATCCTG 
ATCCGCCGCA CCGCGCTGAC CCGGATCGGC GGGATCGAAT CCCTGCGGGG CGCGCTGATC 
GACGATTGCA CCCTGGCCGC GCATGTCAAG CGCAGCGGCG GCGGCCTGTA TCTGGGCCAC 
AGCCGACTGG CCCGCTCGAT CCGCCCCTAT CCGCATCCGG CCGACGTGTG GCGCATGGTG 
GCGCGCACCG CCTATGTGCA ATTGCGCTAT TCGCCGCTGG TCCTGCTGGG CACGGTGCTG 
GGCATGGTCC TGGTCTGGAT CGCGCCGATG CTGCTGGCCC TGTTCGGGCA CGGGGCGCCC 
CGCCTGCTGG GGGTGGCGGC CTGGGTCGCG TCGATGGCGT GCTTCGTGCC GACCCTGCGG 
CGCTTCCGCC TGTCGCCGGG CTGGGCGATG CTGTTGCCGC TGGTCGCGGT CTTCTATACC 
GCCGCGACCC TTGGCTCGGC CATCGACCAC CATCGCGGCC GTGGCGTGGT GTGGAAGAGC 
CGTGCCTATC TCGAACCGAC CGGGGCCGGC GGGCCCGTGC CAGATGACAG GACATGA

Protein sequence

MLLLAVSLLC AAIWIVLIGF HGRFWQGGPI LAPARPSAGM AGQGEWPAVC IVVPARDEAE 
SVQACVASLI GQDYPGALHL ILVDDNSTDG TGALARAVPD PLARLTVITG RERPPGWSGK 
LWAVSQGVAE ARRQVPEDVG YVFLTDADIT HDPAHVATLV AKAEGDGLDM VSEMVELNVA 
SVAEHMLVPA FVFFFALLYP FARVNDPRSR VAGAAGGSIL IRRTALTRIG GIESLRGALI 
DDCTLAAHVK RSGGGLYLGH SRLARSIRPY PHPADVWRMV ARTAYVQLRY SPLVLLGTVL 
GMVLVWIAPM LLALFGHGAP RLLGVAAWVA SMACFVPTLR RFRLSPGWAM LLPLVAVFYT 
AATLGSAIDH HRGRGVVWKS RAYLEPTGAG GPVPDDRT