Gene Gdia_0746 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0746
Symbol
ID	6974143
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	849698
End bp	850756
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	68%
IMG OID	643390275
Product	glycosyl transferase family 2
Protein accession	YP_002275151
Protein GI	209542922
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0487138
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAGCGA GCGTCGTCAT TCGTTCCCGC AACGAAGCGG ACCGGCTGCG CCTGACCCTG 
GCATCGCTTG CCAGCCAGAC CGAGGCCGCG GAAGTCGTCG TCGTCAATGA CGGGTCCACC 
GACCATACGG CGGAGGTCAT CGAAGACGCC AGGGCCGAAC TGGATATCGT GTCCGTTCAC 
CATGCCCGCC CGGCCGGGCG ATCGGCGGCG GCCAATACCG GCGGCACCCA TGCCACGGGG 
GACATCCTGA TCTTCCTGGA TGGCGACACC CTTGCCGGGC CCGACCTGGT CGCGGACCAT 
CTGGCGATCC ACCGCCAACG GCCCGGCGTG GTGGTCCGTG GCGAGAACTT CCATCTGCGC 
TGCACCCGCC CGTTCCTGGA CCCCGAACGC GGCACGCCCC GGCCCGGCGA GGAAGAACGG 
GTCGCGCGCA TGTCGGAGGC CGAACGGGCG CGGGCGATCG TCACCCGCGC GCAGGTCACG 
CAGCGGTTCG ATGAAATTGA CCATCGCGCC CAGGCCGGCG TCTATCCCGG TTTCGGCCCG 
CGCAAGCTGT ACGAACTGGA AATGGAGGCC CTGCGGGCGG AAGGGGATTG CGGCGTCCTG 
TGGGCTGCCG CCGCCGGTGC CAACCAGTCG GTGCCGCGCG ATGCCTTCGC CCGTGCGGGG 
GGATTTCATC CCGACATATC GATCAACGAA CATCGCGAAC TGGCACTGCG CCTGTGCCAG 
GCGGGGCTGA AGATGGTGGC CGGCGCGGCA CGCAGCTATC ACTTGATCCA TCGTAGCGGC 
TGGCGGGACC CGCTGGAGGA CAAGGACTGG GAGGACATCT TCTACCAGGC CCATCCGCGC 
GCCGACGTCG CCCTGCTGCC GCTGCTGTGG CAGAGCCTGA GCGACACCGC GATCATTCCG 
GAAGATTTCC GCATTCTGTC GCTGCCGCAC CTGGCCGAGA TCGCCGGGTC CTACGAGGGC 
CTGCCCAGCC GCGAGGCCGT GCGCGAGGCC TACATGGCGG CACGGGAAGC GACGCTGTCG 
GAGTCCGACA TTCGTTCCAA CATTCCCTGG GGAACATGA

Protein sequence

MRASVVIRSR NEADRLRLTL ASLASQTEAA EVVVVNDGST DHTAEVIEDA RAELDIVSVH 
HARPAGRSAA ANTGGTHATG DILIFLDGDT LAGPDLVADH LAIHRQRPGV VVRGENFHLR 
CTRPFLDPER GTPRPGEEER VARMSEAERA RAIVTRAQVT QRFDEIDHRA QAGVYPGFGP 
RKLYELEMEA LRAEGDCGVL WAAAAGANQS VPRDAFARAG GFHPDISINE HRELALRLCQ 
AGLKMVAGAA RSYHLIHRSG WRDPLEDKDW EDIFYQAHPR ADVALLPLLW QSLSDTAIIP 
EDFRILSLPH LAEIAGSYEG LPSREAVREA YMAAREATLS ESDIRSNIPW GT