Gene GSU2786 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU2786
Symbol
ID	2686974
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	3064891
End bp	3066027
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	70%
IMG OID	637127476
Product	cysteine desulfurase
Protein accession	NP_953830
Protein GI	39997879
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID	[TIGR03235] cysteine desulfurase DndA

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGTCT ACCTGGACTG TAATGCCACG ACCCCCCTGG AGCCGGCCGT CATGGCCGTG 
GTGACCCGCT TCATGGAGCG GGATTACGGC AACGCGGCGA GCCCCATTCA TGATTTCGGA 
GTGTTCGCGC GGCTGGCGGT TGAGCATGCC CGGGGCCAGG TGGCTGAGGT GGCGGCTGCC 
CGGCGGGACG AGGTGATCTT CACCAGCGGG GCTACCGAGG CCGACAACCT GGCGCTCCTG 
GGCCTGGCGG ACCACGGCCT GGCATGCGGG CGACGTCATG TGATCAGCAC GGCCGTCGAG 
CACAAGGCGG TGCTCGAACC GCTGGAAGAG CTGGCGCGCC GCGGATTCCA GGTGGAGCTC 
CTCCCCGTGG GGGCGTCGGG GCGGCTGGAC CCTGACCGGC TGCGTGCGGC GCTCCGGCCT 
GACACCCTTC TCGTTTCCAC CATGCACGTC AACAACGAAA CCGGCGTGGT CCAGCCCCTG 
GCCGAACTGG CTGAGATCCT GGCCGGCCAC GGCGCCTACT GGCACGTGGA CGCGGCCCAG 
GGCTTCGGCA AGGAGATCGA CGGTCTGCGC AATCCGCGGA TCGACCTGAT CGCCGTGAGC 
GGCCACAAGA TCTACGCCCC CAAGGGGGTG GGCGCCCTCA TCGCCCGCAA GCGGGACCGC 
GCCTTTCCGC CGCTGCGGCC CCTGATGCTG GGCGGCGGCC AGGAGCAGGG GCTGCGGCCC 
GGAACCCTGC CCGTCCCCCT CATTGCCGGT TTCGGCGAGG CAGCCAAGCT GGCGGTGCGC 
ACCCACGAGG CGCGCTCCGC CGCCAACCGC GCCTTCCGGG AAAAACTCCT GGCCGCCCTG 
GCCCCACTGG AGCCGACCCT CAACGGCGAC CAGGAGCACG TCCTTCCCCA TGCCGTGAAC 
CTTTCCCTGG CCGGGATCGA GGCCGACCGG GCCATCACCG CCCTCAAGGG GGTCATTGCC 
GTGTCGAGCA CCTCGGCCTG CACCTCCCAC ACCCGGGCGC CGAGCCACGT TCTCACCGCC 
ATGGGGCTTT CCCCGGAGCG GGTCGAGACG TCGCTGCGGC TTTCCTGGTG CCACCTGACC 
CCGGCCGTGG ACTGGGACGA GGTCGTCTCC ATCCTGCGCG GACTCCGCGC ATCATGA

Protein sequence

MTVYLDCNAT TPLEPAVMAV VTRFMERDYG NAASPIHDFG VFARLAVEHA RGQVAEVAAA 
RRDEVIFTSG ATEADNLALL GLADHGLACG RRHVISTAVE HKAVLEPLEE LARRGFQVEL 
LPVGASGRLD PDRLRAALRP DTLLVSTMHV NNETGVVQPL AELAEILAGH GAYWHVDAAQ 
GFGKEIDGLR NPRIDLIAVS GHKIYAPKGV GALIARKRDR AFPPLRPLML GGGQEQGLRP 
GTLPVPLIAG FGEAAKLAVR THEARSAANR AFREKLLAAL APLEPTLNGD QEHVLPHAVN 
LSLAGIEADR AITALKGVIA VSSTSACTSH TRAPSHVLTA MGLSPERVET SLRLSWCHLT 
PAVDWDEVVS ILRGLRAS