Gene GSU1976 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1976
Symbol
ID	2686175
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	2166708
End bp	2167829
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	64%
IMG OID	637126667
Product	glycosyl transferase, group 1 family protein
Protein accession	NP_953025
Protein GI	39997074
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGTTT TGCACGTCAT CGACAGCGGT GGCCTGTACG GAGCCGAAGT CATGCTCCTC 
AATCTCGCTG CCGAGCAGGC CGCCATGGGG CTTGAACCGG TCATCGCCAG CATCGGCGAT 
CCCCTCTGCG GCGAAAAACC GCTGGAAAAG GAGGCAGTAC GGAGGGGGTT GCGGGTGGAG 
AGATTTCGCA TGAGGCCGGG GGCGAATATT GCCGGCGCCT TCAGCGTGCT TCGTTTCGCG 
TGGCGTGAGC AATGCGACGT GCTCCATTCC CACGGCTACA AGGGGAATAT CCTGTTCGGC 
TTCATGCCGC GGGCGCTCCG CCGGCTGCCA ATGGTCACCA CTCTTCATGG CTGGACCTGG 
ACTGGCGGGA TGGACCGGAT GGGCCTCTAC GAATGGCTCG ACCGACTGAG CCTGCGCTTT 
GTGGATGCGG TGGTGATGGT GAACGACGCC ATGCGCCGGA AGATCGACCT TCCCGGCATT 
CACGTGGTGC CTAACGGCAT CCCGCTCGCC GGAGAGGCCG AGCGGCCCGC GGTGCCCCTC 
GACCCCCGGA TCGTAGAGTT CTGCCGGGGA GGCATCACCC TGGGCGCAAT AGGCCGTCTG 
TCCCCGGAAA AGGGGTTCGA TATCCTGCTG GACGCGGTCA GGGAGGTGGC GGAGACGAAT 
CCCGGAGTCC GGCTGGCACT CCTCGGGGAG GGAGTCGAGC GAGACGCCCT GGAGGCGAAG 
ATCCGGGAAC TGGGGCTGAC GGAAAGGGTG CTGCTGCCGG GATATGTGCC GGACGCCAAT 
CGCTACCTGC CCCTGTTCCG GGCGTTTGTG CTCTCGTCGC TGACCGAAGG GCTTCCCATG 
GTCATACTTG AAGCAATGCT GGCCGGGGTC CCGATTGTCG CCACAAGGGT AGGGGGCGTG 
CCCGAAGTGC TGGATGGCGG TGCAGCCGGT CTTCTGGCTG AACCGCGCCA TGCTGGCAGC 
CTTGCAGGGT GCGTGTCGCG CCTGATCGGA GACGACCTAC TGGCCGCGCG TCTCGCGGAG 
CGGGGAAGAC ACTTGGTCGA AACACGCTAC GCAGCCGGCG CGATGGCCAT CAAATACAGC 
GAAATCTATG ACGGTGTTCA TCCCGCCATA CATCGAAAGT GA

Protein sequence

MKVLHVIDSG GLYGAEVMLL NLAAEQAAMG LEPVIASIGD PLCGEKPLEK EAVRRGLRVE 
RFRMRPGANI AGAFSVLRFA WREQCDVLHS HGYKGNILFG FMPRALRRLP MVTTLHGWTW 
TGGMDRMGLY EWLDRLSLRF VDAVVMVNDA MRRKIDLPGI HVVPNGIPLA GEAERPAVPL 
DPRIVEFCRG GITLGAIGRL SPEKGFDILL DAVREVAETN PGVRLALLGE GVERDALEAK 
IRELGLTERV LLPGYVPDAN RYLPLFRAFV LSSLTEGLPM VILEAMLAGV PIVATRVGGV 
PEVLDGGAAG LLAEPRHAGS LAGCVSRLIG DDLLAARLAE RGRHLVETRY AAGAMAIKYS 
EIYDGVHPAI HRK