Gene Sare_4151 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4151
Symbol
ID	5708308
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4718651
End bp	4719751
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	66%
IMG OID	641273579
Product	fumarate reductase iron-sulfur subunit
Protein accession	YP_001538932
Protein GI	159039679
COG category	[C] Energy production and conversion
COG ID	[COG0479] Succinate dehydrogenase/fumarate reductase, Fe-S protein subunit
TIGRFAM ID	[TIGR00384] succinate dehydrogenase and fumarate reductase iron-sulfur protein

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0159941
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00206659
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGGAACTG AGAAGAGCCA GGCGGCTGGT GAGCCGGCCA CGAAGCGGCA GTTCCGCATC 
TGGCGGGGCG ACGAGACCGG CGGCGACCTG CAGGACTACC TGGTCGAGGT GAACGAGGGC 
GAGGTGGTAC TGGACGTCAT CCACCGGCTC CAGAGCACCG ACGCGCCGGA CCTCGCCTGC 
CGTTGGAACT GCAAGGCCGG CAAGTGCGGG TCCTGCTCGG TCGAGATCAA CGGTAAACCG 
AAGCTGGCGT GCATGACCAG AATGTCAACG TTCACCGAGG ACGAGACCAT CTCGGTCACG 
CCGCTGCGGA CGTTCCCGAT CGTTCGGGAT CTGGTCACCG ACGTCTCGTT CAACTACGAG 
AAGGCACGTG AGACGCCGGC CTTCGCACCG CCGCCCGGTG TCACCCCGGG TGACTACCGG 
ATGCAGCAGG TCGATGTCGA GCGCTCGCAG GAGTTCCGTA AGTGCATCGA GTGCTTCCTG 
TGCCAGACGG TCTGTCACGT GATCCGGGAC CACGAGGAGA ACAAGCCGGC TTTTGCCGGA 
CCGCGGTACT TCATCCGGGC GGCCGAGTTG GACATGCACC CGCTGGACAC GCGGGACGAC 
CGCAAGGAGT ACGCACAGGC CGAGCAGGGC TTGGGCTACT GCAATATCAC CAAGTGCTGC 
ACCGAGGTCT GCCCCGAACA CATCAAGATC ACCGATAACG GGATTATCCC CATGAAGGAG 
CGGGTAGTCG ACCGCAAGTA TGATCCCCTA GTGTGGCTTG GTAGCAAGAT CTTCCGGAGG 
GGTCAGGTGC CTCAGACCAG CGTGACCAGC GAGCATTCCC CGGGCGCCGT GCACACCCGC 
GCGGCCGGTC CGCCGGCGGT CCACTCGCAC GCGGGAGGGT CGCACGACCC ACAGGCCGAG 
GCCCAGGCGC AGGCGGGCGT CAACTGGCAC CGCGAGGTGC CGAAGCCGAC CGCACCGGCG 
GTCGACGCGT CCGGCAAGCT TCCGCTGACC GAGCTCACCT TCGATCGGGC GGCGGCGCCG 
TCACCGTTCG GCGACGACGT GAGCTTCCCA CTGCCGCCCG AACATCTGAA CTTCGCCCAC 
CCGGAGCAGG ACAAGCACTG A

Protein sequence

MGTEKSQAAG EPATKRQFRI WRGDETGGDL QDYLVEVNEG EVVLDVIHRL QSTDAPDLAC 
RWNCKAGKCG SCSVEINGKP KLACMTRMST FTEDETISVT PLRTFPIVRD LVTDVSFNYE 
KARETPAFAP PPGVTPGDYR MQQVDVERSQ EFRKCIECFL CQTVCHVIRD HEENKPAFAG 
PRYFIRAAEL DMHPLDTRDD RKEYAQAEQG LGYCNITKCC TEVCPEHIKI TDNGIIPMKE 
RVVDRKYDPL VWLGSKIFRR GQVPQTSVTS EHSPGAVHTR AAGPPAVHSH AGGSHDPQAE 
AQAQAGVNWH REVPKPTAPA VDASGKLPLT ELTFDRAAAP SPFGDDVSFP LPPEHLNFAH 
PEQDKH