Gene RSP_1980 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_1980
Symbol	glcB
ID	3719313
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007493
Strand	-
Start bp	571682
End bp	573898
Gene Length	2217 bp
Protein Length	738 aa
Translation table	11
GC content	69%
IMG OID	640070143
Product	malate synthase G
Protein accession	YP_352031
Protein GI	77462527
COG category	[C] Energy production and conversion
COG ID	[COG2225] Malate synthase
TIGRFAM ID	[TIGR01345] malate synthase G

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.213518
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGCCCG GTTTGCCCCT ATTGCTGCGA CAGAATGTCA TCAGCGGGAG TGGGGTCTTG 
ACCGATCGGA TCGAGAAGCA GGGGTTGCAG GTGGATGTGC GTCTGGCCGA GTTCGTGGCC 
CGCGAGGCGC TGCCCGGCAC CGGTGTCAGC GAGGAAACCT TCTGGGGAGG CCTCGCCGAC 
ACGGTGCGCA CTCTCGGGCC GCGGAACCGC GCCCTCCTCG ACCGCCGCGC CGAGCTTCAG 
GCTGCCATCG ACGACTGGCA CCGCACTCAC CGCGGCGAGC GGCCGAGCCT TAGAGAGTAC 
ACCGCCTTCC TTCGCGAGAT CGGCTACCTG CTGCCGGAGG GGCCCGACTT CACCATCGAG 
ACCGCGCATG TCGATCCAGA GATCGCCGAG GTGGCGGGGC CGCAACTCGT GGTGCCGGTG 
ATGAATGCGC GCTATGCGCT GAACGCGGCC AACGCGCGCT GGGGCTCGCT CTATGACGCG 
CTCTACGGCA CCGATGCTCT GGGCGATCTG CCGGAGGGTG CGGAGTTCGA CCCTGCGCGG 
GGCGCGCGGG TCATCGCCTG GGGGCGCCGG TTCCTCGATG AGACCGCGCC GCTGGCCCAA 
GGCAGCCATG CCGATGTCGA GGGCTACCGG GTCGAGGGCG GCGCGCTGGT GCCCGCACTG 
GCGGATCCCG CGCAATTTGC GGGCCACGCG GGGCCTGCCG AGGCTCCGAC GGCCATCCTT 
CTGAAGAACA ACGGGCTGCA TCTCATCCTC GACATTGATC GCAAGCACCG GATCGGCGCC 
GCCGACCGCG CGGGCGTCGC CGACATCCGC ATGGAGGCCG CGCTGTCGGC CATCATGGAT 
TGCGAGGATT CCGTCGCCGC GGTGGATGGC GAGGACAAGG CGCTCGCCTA CGCCAACTGG 
CTGGGCCTGA TGCGCGGCGA CCTGCGCGAG GCGATCTCGA AGGGCGGGCG GATGTTCGTG 
CGCGAGCTCG CGCCCGACCT CGCCTTCACC GCGCCGGACG GCGGGACCGT CACCCTCAAG 
GGCCGGGCGC TGATGCTCGT GCGCAACGTG GGCCATCTGA TGACCACGCC TGCCGTGCTC 
GACGAGACTG GCGCCGAGAT CTTCGAGGGG ATGCTCGATG CCTTCGCCAC CACCCTCTGC 
GCCCTGCACG ATCTGGCCAA GGCCGACGGC ATCCGGAACT CGGTCGCAGG CTCGGTCTAT 
GTGGTGAAGC CCAAGATGCA CGGGCCCGAC GAGGTGGCCT TCGCCGACGA GCTCTTCACC 
CGCGTGGAGG AGGTGCTGGG CCTGCCGCAC TACACGGTGA AGCTCGGCAT CATGGACGAG 
GAGCGGCGCA CCTCGGTCAA TCTGAAGGAG TGCATCCGGG CCGCGAAGCA TCGGGTGGCC 
TTCATCAACA CGGGCTTCCT CGACCGGACG GGCGACGAGA TCTTCACCGG CATGGAGGCG 
GGCCCGATGG TGAAGAAGGG GGACATGAAG GCCTCGCGCT GGATCGCCTC CTACGAGGAT 
CGCAACGTGG ACATCGGTCT GGCCTGCGGC CTGCGCGGGC GCGCGCAGAT CGGCAAGGGC 
ATGTGGGCCA TGCCCGACCG GATGGCCGAG ATGCTGGCCG CCAAGATCGG CCACCCGAAG 
GCCGGAGCGA GCTGCGCCTG GGTGCCCTCG CCCACGGCCG CAACCCTGCA TGCCACCCAT 
TATCACCGGG TGGACGTGAC CGCGCGCCAG AAGGAGATCG CGGCGGGCGG ACCGCGCGGC 
AGCCTCGAGG ACCTGCTGAC GCTGCCGGTG GCCGAGGGAG TGAACTGGTC CGAGGCCGAG 
CTGCGCCAGG AGATCGAGAA CAATGCCCAG GGCATCCTCG GCTATGTGGT GCGCTGGGTG 
GATCAGGGCG TCGGCTGTTC GAAGGTGCCC GACATCAACG ACGTGGGCCT GATGGAAGAC 
CGCGCCACCT GCCGGATCTC CAGCCAGGCG CTGGTGAACT GGCTGCACCA CGGTGTCGTG 
TCGGAAGATC AGGTGATGGC GGCGCTGAAG AAGATGGCCG CCGTGGTGGA TGCGCAGAAT 
GCCGGCGATC CGGCCTACCG GCCCATGGCG CCCGGCTTCG ACGGCGCGGC CTTCCAGGCG 
GCCTGCGACC TCGTCTTCAA GGGCCGCGAG CAGCCCTCGG GCTATACCGA GCCGGTGCTC 
CATGCCCGGC GCCTGCAGGT GAAGGCCGAG CGCACGCCGC AGGTCAGCCG CGCCTGA

Protein sequence

MRPGLPLLLR QNVISGSGVL TDRIEKQGLQ VDVRLAEFVA REALPGTGVS EETFWGGLAD 
TVRTLGPRNR ALLDRRAELQ AAIDDWHRTH RGERPSLREY TAFLREIGYL LPEGPDFTIE 
TAHVDPEIAE VAGPQLVVPV MNARYALNAA NARWGSLYDA LYGTDALGDL PEGAEFDPAR 
GARVIAWGRR FLDETAPLAQ GSHADVEGYR VEGGALVPAL ADPAQFAGHA GPAEAPTAIL 
LKNNGLHLIL DIDRKHRIGA ADRAGVADIR MEAALSAIMD CEDSVAAVDG EDKALAYANW 
LGLMRGDLRE AISKGGRMFV RELAPDLAFT APDGGTVTLK GRALMLVRNV GHLMTTPAVL 
DETGAEIFEG MLDAFATTLC ALHDLAKADG IRNSVAGSVY VVKPKMHGPD EVAFADELFT 
RVEEVLGLPH YTVKLGIMDE ERRTSVNLKE CIRAAKHRVA FINTGFLDRT GDEIFTGMEA 
GPMVKKGDMK ASRWIASYED RNVDIGLACG LRGRAQIGKG MWAMPDRMAE MLAAKIGHPK 
AGASCAWVPS PTAATLHATH YHRVDVTARQ KEIAAGGPRG SLEDLLTLPV AEGVNWSEAE 
LRQEIENNAQ GILGYVVRWV DQGVGCSKVP DINDVGLMED RATCRISSQA LVNWLHHGVV 
SEDQVMAALK KMAAVVDAQN AGDPAYRPMA PGFDGAAFQA ACDLVFKGRE QPSGYTEPVL 
HARRLQVKAE RTPQVSRA