Gene GSU2098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU2098
Symbol	cooS
ID	2687851
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	2305590
End bp	2307512
Gene Length	1923 bp
Protein Length	640 aa
Translation table	11
GC content	67%
IMG OID	637126789
Product	carbon monoxide dehydrogenase subunit
Protein accession	NP_953147
Protein GI	39997196
COG category	[C] Energy production and conversion
COG ID	[COG1151] 6Fe-6S prismane cluster-containing protein
TIGRFAM ID	[TIGR01702] carbon-monoxide dehydrogenase, catalytic subunit

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACCAGG CACGCAACGG TCATGACAGC CGCAGTATCG ATCCGGCCGC GAAGGAGATG 
CTGCGTATCG CCGACCGCGA AGGATACGCA ACCATCTGGG AGCGTTACGA ACAGCAGCAG 
CCCCAATGCA GCTACGGCCA GCTCGGCACC TGCTGCCGGA TCTGCTCCAT GGGACCGTGC 
CGGATCGACC CCTTCGGCGA CGGCCCCACC CGCGGGGTCT GCGGGGCCAC CGCCGATACG 
ATGGTGGCGC GCAACTTGGC CCGGATGGCC GCGGTTGGTT CCTCCTCCCA CTCCGATCAC 
GGCCGGAAGG TGGCGCTGCT CCTCAAGGCG GTGGCCAACG GCAGCAACAC CGACTACCAC 
ATTGCCGACC CGGACAAGCT CACGGCGGTT GCGGAGCGCC TGGGCATCCC CACGGCCGGC 
CGGTCGACCG CCGAGATAGC CGGCGACGTG GCAGCGGTGG CCATCGACTG TTTCGGCAAC 
CAGGGGGAAG AGCCCATCGT CTTCATGGAG AAGTACATGC CCAAGAAGCG GTTCCAGCGC 
CTGCGGGAGC TGGAGGAGAC CCTCTACCGC ACCACGGGCG CGAAGACCGG GCTCCTGCCG 
CGGGCCATCG ACCGGGAGGC CGTTGACATC CTGCACCGCA CCCACTTCGG CTGCGACCAC 
GATCCCCTTT CCCTGGTGGC CCAATCTGTC CGCTGCTCCC TTTCCGACGG CTGGGGGGGC 
TCCCTGATCG CCACCGAGCT GCAGGACATC CTGCTCGGCT CGCCCATCAT CAGGCCGGTG 
AAGGCCAATC TCGGCGTGCT GGAGGCGGAG AGCGTCAACG TGGTGGTCCA CGGCCACGAG 
CCCATCCTGT CGGCCAAGGT GGTGGAGATG GCCCAGTCCC CCGAATGTCG CGCCGCGGCC 
GAGGCCGTGG GGGCCAAGCG GGTCAACGTG GTGGGGCTCT GCTGCACCGG CAACGAGGTG 
CTGCTGCGCC AGGGGGTCGG CATGGCGGGG AACGAGTCCC ACAGCGAGCT GGCCATCATG 
ACCGGTGCCG TCGACGCCAT GGTGGTGGAC GTGCAGTGCA TCTACCCGGC CCTGGCCGAT 
CTCGCCTCCT GCTTCCACAC CAAGTTCGTC ACCACGAGCG AACAGGCCAA GATCCCCGGC 
GCGCTCCACA TCCAGTTCGA AGAGCACGAG GCCGACGCCA TCGCCACCCG CATCATCAAG 
ACCGCCATCG ACGCCTTCCC GAACCGCAAC AAGGCCCGTG TCTACATCCC GCAGCACACC 
AGCACCGCCA TTGTCGGCTT CACCGTGGAG GAGATCCTCA AGGCGCTCGG CGGAACGCCC 
CAGCCCCTGA TCGACCTGAT TGTCACGGGG ACCATCAAGG GGGTCGCCGG CATCGTCGGC 
TGCAACAACG TGAAGGTGCA GCAGGATTTC TTCCACCGCA CCCTGACCGA GGAGCTGATC 
AAGCGCGACA TCCTCGTGAT CGGCACCGGC TGCTGGGCCA TTGCCGCGGC AAAGTCGGGG 
CTCATGGACC TGCCCGCCCG CGAGCTGGCC GGACCGGGGC TCCAGGCGGT ATGCGGCCAG 
CTGGGGATTC CACCGGTCCT CCACATGGGC TCGTGCGTCG ACTGCTCGCG GATGCTCAAC 
CTGGCCGGGG CCCTGGCGGA TCACCTGCAG GTGGACATTT CCGATCTGCC CCTGGTCGGG 
TCCGCGCCCG AATGGACCAC GGAGAAGGCG GTCGCCATCG GCACCTATTT CGTCGGCTCG 
GGCATTCCCG TGCACCTGTG GCCGCTGCCG CCCATCCTGG GCGGACCGCA GGTAACGAAG 
ATCCTCACCA GCGACGCCAA GGATGTCCTG GGCGGGTGGT TCTTCGTGGA GGAAGACCCG 
AAGGCCACGG CCGACCGGAT GGAGCAGATC ATCATGGAGC GGCGCGCCGC CCTCGGGATC 
TGA

Protein sequence

MDQARNGHDS RSIDPAAKEM LRIADREGYA TIWERYEQQQ PQCSYGQLGT CCRICSMGPC 
RIDPFGDGPT RGVCGATADT MVARNLARMA AVGSSSHSDH GRKVALLLKA VANGSNTDYH 
IADPDKLTAV AERLGIPTAG RSTAEIAGDV AAVAIDCFGN QGEEPIVFME KYMPKKRFQR 
LRELEETLYR TTGAKTGLLP RAIDREAVDI LHRTHFGCDH DPLSLVAQSV RCSLSDGWGG 
SLIATELQDI LLGSPIIRPV KANLGVLEAE SVNVVVHGHE PILSAKVVEM AQSPECRAAA 
EAVGAKRVNV VGLCCTGNEV LLRQGVGMAG NESHSELAIM TGAVDAMVVD VQCIYPALAD 
LASCFHTKFV TTSEQAKIPG ALHIQFEEHE ADAIATRIIK TAIDAFPNRN KARVYIPQHT 
STAIVGFTVE EILKALGGTP QPLIDLIVTG TIKGVAGIVG CNNVKVQQDF FHRTLTEELI 
KRDILVIGTG CWAIAAAKSG LMDLPARELA GPGLQAVCGQ LGIPPVLHMG SCVDCSRMLN 
LAGALADHLQ VDISDLPLVG SAPEWTTEKA VAIGTYFVGS GIPVHLWPLP PILGGPQVTK 
ILTSDAKDVL GGWFFVEEDP KATADRMEQI IMERRAALGI