Gene GSU2088 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU2088
Symbol
ID	2687865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	2293668
End bp	2294822
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	66%
IMG OID	637126779
Product	glycosyl transferase, group 2 family protein
Protein accession	NP_953137
Protein GI	39997186
COG category	[R] General function prediction only
COG ID	[COG1216] Predicted glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCATCCT TCTCCGTCGA CATACTCGTT CCCGTCTGGA ACCGTCCCGT TGAGACACGC 
AACTGTCTCG TGTCACTCGT GGAGTCCACT CAGGAAGCTC GCCTCATCCT CATCGACAAT 
GGCAGCGACC GGGAAACCGA ACGACTCCTC GAAGAGTTCG CCGAGCGGCT CGGCGAGCGG 
GCCCTGCTCC TGAGGAACGA TATCACCAGC GGCTTTGTTC CGGCGGTGAA CCGTGGCCTG 
TCCCGGGCCG AAGCCCCCTT CGTCGTGATC GTGCGTAATA CCACAGTTGT GGCGCCCGGC 
TGGCTCGAGC CACTGGTGGA ACTGGCGAGG GCACGGTCCG AGATTGGTCT CGCAGTTCCC 
CTTCTGGTGT TGGATGCCGC CACGTCGCGC CGCGGCAGGG GGAAGCCTGA TGTGACGGTA 
ACCGAGGTCT CCCACGGCTC CTTTGCGGCG ATGCTGATCC GTCGTTCCCT GTTCGAGCGC 
ATGGGCGGCT TTGACGAAGA ACTGGACGGC GATCTCTTGT GTCTCAGGGA CTACTCCCGC 
CGGGCCCTGG CCGGAGGGTG CCTGACCCTG GCAGCCGAAG GCGTGCCGGT GGCCTTTCGG 
GATGAGGTGC TGCTCGGCTC GCCCACGCGC CGCCGGGAGC TGGTCAGTGC CAGCGTGGCA 
ACGGTGGATG CCCGTTGGGG CCGCGAGGCT TCGTTCCTCG TCTATTTCCC TGCCGAGGCG 
GACCCGGAGG TCGTGCGCGC CCGATTCGGC GTGCTGCTGC GAGCGGCCCG CATGGGCCAT 
CGCTTCACCG TGGCGATCGG TTGTAAACTC AGGCGGGCGG TTTCTGCCGC AGGGCTCGGT 
TCCCTGCACC GCAGCATCGT CGTGGAGGAA CTGCCGCGCT TTTTCGCCCC CTCCGCCCTC 
CGCAGGATCG CGGACCGCTG TGCGGCCGAG GAGAACGACC TCGTCTGGGT GGCAGGGATC 
GACGGCATTG ATCTGCCCGG GGAAATGTTC TTTCGTCCAT TCGCGTGGCT CGAGGGGGAG 
GTCGATGCCC GGGAAGAGGA GCTCTACCGG CGCGAAGGGG AGCAAAATCC GGTGACAGCC 
CCGGCCGATT GCGTTACAGT AGCAATTTCC GACGGAACCC GCCAGGGGGA TGAGCGGAAG 
GAGGTGGCCC AGTGA

Protein sequence

MASFSVDILV PVWNRPVETR NCLVSLVEST QEARLILIDN GSDRETERLL EEFAERLGER 
ALLLRNDITS GFVPAVNRGL SRAEAPFVVI VRNTTVVAPG WLEPLVELAR ARSEIGLAVP 
LLVLDAATSR RGRGKPDVTV TEVSHGSFAA MLIRRSLFER MGGFDEELDG DLLCLRDYSR 
RALAGGCLTL AAEGVPVAFR DEVLLGSPTR RRELVSASVA TVDARWGREA SFLVYFPAEA 
DPEVVRARFG VLLRAARMGH RFTVAIGCKL RRAVSAAGLG SLHRSIVVEE LPRFFAPSAL 
RRIADRCAAE ENDLVWVAGI DGIDLPGEMF FRPFAWLEGE VDAREEELYR REGEQNPVTA 
PADCVTVAIS DGTRQGDERK EVAQ