Gene Gdia_0643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0643
Symbol
ID	6974040
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	730517
End bp	731758
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	66%
IMG OID	643390174
Product	glycosyl transferase group 1
Protein accession	YP_002275050
Protein GI	209542821
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	0.984184
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGTCCA ACCCGATCCT GATGGATATT TCCCGGCTGC TGTCGCGTGC CGGCAGCGCG 
GTACCGACGG GAATCGATCG TGTCGAGCTG GAATACGCGC TGTATCTGTC ACGGAATTTC 
CCGGCGCGGG TGACCTTCGT GGCCTATCAC CCGCTGGGGC GGATCGGGGT CCTGCCGCGC 
CGTCCCACAA CCTGGTTCCT GCGGATGCTG GCGCGGGCCT GGACGAACGG GACGCGGCCC 
TGGCGCGGGG CGTCACTGAT GGCCGGGCTG CTGCTGCAGG CGGCGGCGGC CGGCACGGTT 
GGCGAGACCG CGCGGCGCCG GCTGTATCTG CTGCTGTCGC ATCATCACCT GATGAAGCGT 
GACGTGATCG CCGGTTTCAT GGATCGGGCG AATGCCGGAT TGGCCGTCAT GGTCCACGAC 
CTGATACCGA TCGACTATCC GGAATATGCC CGCCCGACCG AACCGGACCG CCATCGGCAG 
CGTATGGACA CGGTGGGCCA ACTGGCGGAT TCCGTCATCG TGCCCTCGCA GGCCGTGGCG 
GACTCCCTGC GGCACTACCT GGCGCCGGGT GGCCGCTGCC CGCCGATCGG CGTGGTGCAC 
CATGGATGCC ATGTCGATCC AATCTCCACG ATCCCGGTCA GCGGCCTGGC GCCGGATGTC 
CCGTATTTCG TCGTGCTGGG AACGATCGAA CCGCGAAAAA ATCATTTATT ATTGCTTAAT 
ATCTGGCGGC ATATGGCAAC GGGACGTGAC CGGAGCCGGT TGCCGCATCT GGTCGTCATC 
GGGCGCCGCG GCTGGGAAAA CGAAAATATA CTCGACATGA TGGAACGTTG CCCCGCCCTT 
CAGGGGGTCG TGCACGAATA CGCGACATTG TCCGATGTGG TGGTCGCTGA TCTGGTCCGG 
GGGGCGCGCG CCCTGCTGTT TCCCTCGTTC GCCGAAGGAT TCGGCCTGCC GTTGCTGGAG 
GCCCTGTCCA TGGGCACCCC TTGCCTGTGC AGCGACCTGC CGGTCTTTCG CGAAATCGCC 
GGAGATCTGC CCTGTTACCT GGACCCGCTG GATGGACCCG GCTGGCAGCG CAGGATCCTG 
GACCTGGCCG GAGAGGACAC GCGCGAGAAC GGCGAGACGC CGGTCTTTGC CGACTGGCCG 
GCCCAGGTGG CGGCCGGGTT GGCGACGATC GACGGCGCGG TGCGTGCCGA TGCGGCGGCG 
GCCGTTCGTC CGATGAACGT GGAAGCGAGG ACGGCGTGCT GA

Protein sequence

MMSNPILMDI SRLLSRAGSA VPTGIDRVEL EYALYLSRNF PARVTFVAYH PLGRIGVLPR 
RPTTWFLRML ARAWTNGTRP WRGASLMAGL LLQAAAAGTV GETARRRLYL LLSHHHLMKR 
DVIAGFMDRA NAGLAVMVHD LIPIDYPEYA RPTEPDRHRQ RMDTVGQLAD SVIVPSQAVA 
DSLRHYLAPG GRCPPIGVVH HGCHVDPIST IPVSGLAPDV PYFVVLGTIE PRKNHLLLLN 
IWRHMATGRD RSRLPHLVVI GRRGWENENI LDMMERCPAL QGVVHEYATL SDVVVADLVR 
GARALLFPSF AEGFGLPLLE ALSMGTPCLC SDLPVFREIA GDLPCYLDPL DGPGWQRRIL 
DLAGEDTREN GETPVFADWP AQVAAGLATI DGAVRADAAA AVRPMNVEAR TAC