Gene Gdia_0624 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0624
Symbol
ID	6974021
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	699467
End bp	700606
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	70%
IMG OID	643390155
Product	glycosyl transferase group 1
Protein accession	YP_002275031
Protein GI	209542802
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.225322
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATTC TCGAAATCAC CAATGTCGAT TTTTCGCTGC GGCACTTCCT GCTGCCGCTG 
ATGCGGGGCC TGCGCGCCGA TGGGCACGAG GTCGTCGGCG TCTGCGCGGA CGGTCCCCTG 
CTGGCCGATG TGCGCGGCGA GGGATTCCGC GTCGAGACGG TGCCGCTGGT CCGATCCTTC 
TCGCCCCTGG CGCAGATGCA GGCGCTGATC GCGCTGGTCC GGCTGATCCG GGAGGAAAAG 
CCGGACATCG TCCACGCCCA CATGCCGATC AGCGGCCTGC TGGGCCGCCT GGCGGCGTGG 
CTGTGCCGCG TGCCGTGCGT GGCCTATACC TGCCATGGCT TCCTGTTCAA CCAGCCGGGG 
CCCGCCCCAC GGCGCGGTCT GGCGCTGGTG CTGGAATGGC TGGCCGGGCG GATCACCGAC 
CGGTATTTCA CCGTATCGGT GCAGGAGGCC GAGGACGCCC GGCGCCTGAA GATCCACCCG 
GCGCCGCTGG CGGTGGGCAA TGGGCGCAAC CCCTCCCTCT TCCAGCCCGA TCCCGAGGCA 
CGGCGGCGGA TTCGCGCCGA ACTGGGGGTG GCGGAAGGGG CGGTGGTCAT CATCGCCGTG 
TCACGGCTGG TGCGGCACAA GGGCTATCCG GAACTGCTGA AGGCGATGGA GCAGGTGTCC 
GGCGCGATGC TGTGGGTGGT GGGCGAACGC CTGGAGTCCG ACCATGGAGA ATCGCTCGAT 
TCGTGCTTCG AGGAGGCGCA GCGGGTACTT GGCGCGCGGC TGCGGTGCCT GGGCTATCGC 
GAGGACGTTC CGGCCCTGCT GGCGGCGGCG GATATCTTCA CCCTGCCCAG CCATTTCGAG 
GGACTGCCGA TGTCGGTGAT CGAGGCGATG CTGACCGGCC TGCCGGTGGT GGCCAGCGAT 
ATTCGCGGCC CGCGCGAACA GGTCGTGAAC GGCCGTACCG GGCTGCTGGT TCCCCCGGGC 
GAGGCCGTGC CGCTGGCGCG CTCCCTCGGC TGCCTGGTCC GCGACCCGGA CCTGCGCTAT 
CGGATGGGCG AGGTCGGGCG TGAGAGGGCC CGCGCCCGGT ATGACGAGGA CATCGTGGTC 
GGCCGCACCA AGATGGCCCT GCTGGCACCC GGGACGACGC CGACCGACGA TGCCGGCTGA

Protein sequence

MKILEITNVD FSLRHFLLPL MRGLRADGHE VVGVCADGPL LADVRGEGFR VETVPLVRSF 
SPLAQMQALI ALVRLIREEK PDIVHAHMPI SGLLGRLAAW LCRVPCVAYT CHGFLFNQPG 
PAPRRGLALV LEWLAGRITD RYFTVSVQEA EDARRLKIHP APLAVGNGRN PSLFQPDPEA 
RRRIRAELGV AEGAVVIIAV SRLVRHKGYP ELLKAMEQVS GAMLWVVGER LESDHGESLD 
SCFEEAQRVL GARLRCLGYR EDVPALLAAA DIFTLPSHFE GLPMSVIEAM LTGLPVVASD 
IRGPREQVVN GRTGLLVPPG EAVPLARSLG CLVRDPDLRY RMGEVGRERA RARYDEDIVV 
GRTKMALLAP GTTPTDDAG