Gene Gmet_2006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gmet_2006
Symbol
ID	3739878
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter metallireducens GS-15
Kingdom	Bacteria
Replicon accession	NC_007517
Strand	-
Start bp	2244290
End bp	2245477
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	59%
IMG OID	637779300
Product	cysteine desulphurases, SufS
Protein accession	YP_384960
Protein GI	78223213
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily

Plasmid Coverage information

Num covering plasmid clones	68
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACATTC AGAAAATCAG GGGAGATTTC CCCATCTTTG AGAGGCGCAT CAACGGGAAG 
CCGATAGTCT ATTTCGACAG CGCCGCCACG ACCCAGAAGC CTCGCCAGGT GATCGATACG 
CTTTCGAACT ACTACGCGAA CCACTGCGCC AATATCCACC GCGGGGTGCA CACCCTTTCC 
CAGGAGTCGT CGGAGCTCTA TGAGGAAGCG CGCCGGACCG TTGCCCGTTT CATCAATGCC 
GACGAGCGGG AAATCGTCTT TGTCAGGAAC ACGACCGAAG CGATCAATCT GGTAAGCACC 
TGCCTGAAGG GGGAGGGGCA GATTCTGTCC ACCGTTACCG AGCACCACTC GAATCTCCTT 
CCGTGGGGAC GTTCACGGAA GGTAGACTAT GTGGATATCG ACGCCCAGGG GCGGATAGAT 
GTGGCGGATC TGAAGGAAAA ATTGCTGAAA CCGACGCTCC TGGTCGCGGT GACCCACGTC 
TCCAACGTAC TTGGTCTGGT CAATCCGGTG GAAGAGGTGA TAGCCGAGGC GCGGAAAAAC 
GGGGCGCTGA CACTGGTTGA TGCGGCCCAG TCGGCGCCGC ACATGGAGAT CGACGTCAAG 
GCGATGGGAT GCGATTTCCT GGTTTTCAGC GGGCACAAGA TGCTGGCGCC CTCGGGTATC 
GGCGTCCTCT ATGTGCGGGA AGAGCTCTAT GAGCGGATGG AACCGTATCT CATGGGGGGG 
AGCACCATCA AGGAGGCCCA CCTGGGAAGT TATGTTCCTG AGGAACCCCC CACCTGCTAT 
GAGGCGGGAA CGCCCAACAT CGAGGGTGCT ATTGCGCTGG CCAGCGCCAT CGACTACCTG 
AACGACATCG GCATGGACAA CGTGCTGGCC CACGACAAGG CCTTGATGGC GTTGGCCCTG 
GAGAGGATGA AGGCCATCGA CAATGTAGAA CTATACGGCA GCCTCGATCC CACGGACCGG 
CTCTCCGTCA TCACCTTCAA TGTCAAGGGG ATGGGGTGCC ACGGCGTGGC CAAGGTGCTG 
AACCTGCGGG AGAACATCAT GATCCGCTCG GGCTTCCACT GCGCTCAACC GCTCCATGAC 
CGGCTCGGCA TCGGGCCGAC GGCGCGGATG TCCTTCTATA TCTACAATAC GCCTGAAGAG 
ATCGAGCTTG CGGCGGAGCT TCTCGGGAAG ATTGCGGAGT TTATGTGA

Protein sequence

MDIQKIRGDF PIFERRINGK PIVYFDSAAT TQKPRQVIDT LSNYYANHCA NIHRGVHTLS 
QESSELYEEA RRTVARFINA DEREIVFVRN TTEAINLVST CLKGEGQILS TVTEHHSNLL 
PWGRSRKVDY VDIDAQGRID VADLKEKLLK PTLLVAVTHV SNVLGLVNPV EEVIAEARKN 
GALTLVDAAQ SAPHMEIDVK AMGCDFLVFS GHKMLAPSGI GVLYVREELY ERMEPYLMGG 
STIKEAHLGS YVPEEPPTCY EAGTPNIEGA IALASAIDYL NDIGMDNVLA HDKALMALAL 
ERMKAIDNVE LYGSLDPTDR LSVITFNVKG MGCHGVAKVL NLRENIMIRS GFHCAQPLHD 
RLGIGPTARM SFYIYNTPEE IELAAELLGK IAEFM