Gene GSU1089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1089
Symbol
ID	2686929
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	1174351
End bp	1175457
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	63%
IMG OID	637125758
Product	iron-sulfur cluster-binding protein
Protein accession	NP_952142
Protein GI	39996191
COG category	[R] General function prediction only
COG ID	[COG2768] Uncharacterized Fe-S center protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0040129
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGAGCA CCGTTTACTT CAGCGACATG CGGGCGGGAC ACAAGGAGAA CCTTTTCGCC 
AAGATCGGTA AACTCATGAT CCTGGCCGGT GCCAGGGAAC GGATCGCCAC GGGCGACCTG 
GTGGCGGTAA AGGTCCACTT CGGAGAGCGG GGAAATCATG CGTTCATCCG CCCCATTTTT 
ATCCGGCGCG TGGTGGACGA AATCAAAGGA TGCGGCGGAA AGCCCTTTCT CACCGACTCC 
TCAACCCTCT ACCCCGGCGA GCGCAAGGAA GCGGTCTCCG CGCTGATCTG TGCCATCGAG 
AACGGCTTCG ACTTTGCGGT TGCCGGCGCT CCCCTCGTCA TGTGCGACGG ACTCCGGGGC 
AACTCGGCCA TTGTCGTTGA GGTGAACGGC GAACTGCTGA AGAAGGTCCC CATCGGCTCC 
GCCATCGTCG AGGCCGACGC CCTGGTAGCC GTCTCCCACT TCAAGTGCCA TGAGTTGACC 
GGCTTCGGCG GCGCCCTGAA GAACCTGGGC ATGGGCTGCT CAAGCCGCGA GGGGAAGCTG 
ACCCAGCATT CCACCGTGGC GCCCAGGGTG GCCGAAAAAT ACTGCACCGG CTGCGGGCTC 
TGCCTGAAGG CCTGTGCCCA CGACGCCATC GCCATCATCG AGGGGAAGGC CAAGATCGAC 
CCGAAGGCGT GCGCCGGCTG CAGCCGCTGC ATCACCGTCT GCCCCACCAA GGCCATCACC 
ATCCAGTGGA ACGAGGCCGC CGACCTGGTC ATGAAAAAGA TGGCCGAATT CGCCAAAGGG 
GCCGTGACGG GCAAGCAGCA CAAGACCCTC TTCCTCAACT TCATCACCCA GGTCTCCCCG 
GCCTGCGATT GCTACGGCCA CGCCGACGCC CCCATCGTGA ACGACATCGG CATCTGCGCC 
TCCACCGACC CCGTTGCCCT GGACCAGGCC TGCGCCGACC TGGTCAATGA CGCCGTGGGC 
AACCAGAATA CGGCGTTGGC CACCGGCCAT GAGCCGGGGG GTGACAAGTT CCGCGGGGTT 
CACCCGGACA TCGATTGGGA GATTCAGCTG GAGCATGCCG AGAAGATCGG CATGGGGACG 
CGCGAGTATG ATCTGGTGAG AATCTGA

Protein sequence

MPSTVYFSDM RAGHKENLFA KIGKLMILAG ARERIATGDL VAVKVHFGER GNHAFIRPIF 
IRRVVDEIKG CGGKPFLTDS STLYPGERKE AVSALICAIE NGFDFAVAGA PLVMCDGLRG 
NSAIVVEVNG ELLKKVPIGS AIVEADALVA VSHFKCHELT GFGGALKNLG MGCSSREGKL 
TQHSTVAPRV AEKYCTGCGL CLKACAHDAI AIIEGKAKID PKACAGCSRC ITVCPTKAIT 
IQWNEAADLV MKKMAEFAKG AVTGKQHKTL FLNFITQVSP ACDCYGHADA PIVNDIGICA 
STDPVALDQA CADLVNDAVG NQNTALATGH EPGGDKFRGV HPDIDWEIQL EHAEKIGMGT 
REYDLVRI