Gene Gdia_3101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_3101
Symbol
ID	6976535
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	3395702
End bp	3396811
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	75%
IMG OID	643392609
Product	glycosyl transferase group 1
Protein accession	YP_002277446
Protein GI	209545217
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	0.542778
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGACCG TCCTCGTCTA TCGCGATCGG CTGCTGCCGC CCTCGGAACA GGCCTTCATG 
CGGCGGCAAT ATATGGGGTT TCGCACTCTC CGGCCCTGCT GGGTCGGGTG CCGGCGCGAT 
GCCCCCGCGC CCGACTTGCC GGGTGATGTG CGTTTCCTCG GCGGCAGCGG GCCCCTGCGG 
CCGCTGCGCC AGATGGCGTT CCGGCAGTTC GGCTGGGGCG CGGCGCGCGA GGTCGCGGAC 
CTGGCGCCCG TGCTGGTGCA TGCCCAGTTC GGGCGCGGGG GCGCGCTGGC CCTGTCGATC 
GCCCGGGCAC TGGGCGTGCC GCTGGTGGTG ACGTTCCATG GCGGCGACGC GTTCAAGGAC 
CGGCATTACG CGGGCGGCTT TCCGCCATCG GTGTTCCAGC GGCGCTGGCA GGCGCTGCAA 
TCCCATGCCG CGCTGTTCGT CTGCGTGTCC GAGGGCGTGC GCGACCGGTT GCTGGAACGC 
GGGGTGCCGG CCCGACTGCT GGAGGTGATT CCCATCGGGG CGGAGCCCGC CCCCCTGGCC 
GCCGGCCCCG CCGACCGCTT CGTCTTCGCC GGGCGCTTCG TGGACAAGAA GGGGGTGCCG 
GTGCTGATCG ACGCGGTGCG GATTCTGGCC GGGCGCGGGG TGACGCCCCC GGTCGTTCTG 
GCGGGGGACG GGCCGCTGCT GCCGGCGATG CGCGACCGTG CGGCGGGCCT GGCCAACCTG 
CGCTTCGCCG GCTGGCTGGG GGCGGCGGAC CTGGCGGCGG AGATGGACCG GGCGATCGCG 
CTGCTGGTGC CCAGCGTGGT GCCGCCCGGC GGCGACCGCG AGGGCCTGCC CAGCGTCGCG 
GTGGAGGCCA TGGCGCGCGG CGTGCCGGTC GTCGCCTCCA GCCAGTCGGG GCTGGAGGGC 
GCGGTGGGGC ATGCGGGGGC CGGGATCGTG GTGCCGGCCG GCGATCCGAT GGCGCTGGCG 
GATGCGATGC AGGCGATGCT GGTCCCCCGG ACCCGCGATG CGATGGCGGG CGCGGCGGCG 
GCGACGGCGC GGGAGTCGTT CTGCGCGCCC GTCCAGTCCG CCCGGCTGGA GGCACGGCTG 
CTGTCGCTGC TGCCAGGGGC GACGGGATGA

Protein sequence

MKTVLVYRDR LLPPSEQAFM RRQYMGFRTL RPCWVGCRRD APAPDLPGDV RFLGGSGPLR 
PLRQMAFRQF GWGAAREVAD LAPVLVHAQF GRGGALALSI ARALGVPLVV TFHGGDAFKD 
RHYAGGFPPS VFQRRWQALQ SHAALFVCVS EGVRDRLLER GVPARLLEVI PIGAEPAPLA 
AGPADRFVFA GRFVDKKGVP VLIDAVRILA GRGVTPPVVL AGDGPLLPAM RDRAAGLANL 
RFAGWLGAAD LAAEMDRAIA LLVPSVVPPG GDREGLPSVA VEAMARGVPV VASSQSGLEG 
AVGHAGAGIV VPAGDPMALA DAMQAMLVPR TRDAMAGAAA ATARESFCAP VQSARLEARL 
LSLLPGATG