Gene Rsph17025_0206 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_0206
Symbol
ID	5082145
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	+
Start bp	197387
End bp	199453
Gene Length	2067 bp
Protein Length	688 aa
Translation table	11
GC content	71%
IMG OID	640481761
Product	hypothetical protein
Protein accession	YP_001166421
Protein GI	146276262
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.277086
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.243086
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGGAA GCGTCGTCTT CGACCCGATC CTGCCCTGGG CCGTCATCTG GACCCTGGCC 
GCCCTCGGAG CCGTCATGGT GGTGCTCGCA CTCTGGCGCG GTCTCTCGGG CTGGTGGCTG 
CGCGGGCTGG CGCTCGGCGT GCTGCTCTTG GCGCTGGCCA ATCCTGCGCT GCAGGAAGAG 
GATCGCGCGC CGCTCTCCGA CATCGTGATC GCGGTGGTGG ACGAAAGCGC GAGCCAGCGG 
ATCGGTGACC GCCAGGCCCA GAGCGCGGCG GCGCTGGCGG CGGTCGAGGC CGAGATCCGG 
GCCCTGCCCG ATACCGAACT GCGCGTGGTG CGGGTGGGCG ATGGCGAAGG CGACGAGGGC 
TCTCTCGTGA TGACCGCCTT GGCCGAGGCG CTGGCCGAAG AACCGCGGGC GCGCATCGCG 
GGGGCCATCC TGATCACCGA CGGGCAGGTC CATGACCTCG AGCTTGCGCC GCAGATGCCC 
GCGCCGCTCC ATGTGCTGCT GACCGGCCAC GAGGAGGACT GGGACCGCCG GCTGGTGATC 
CGCAACGCGC CGGCCTTTGC GATCCTGGGC GAGCCGGTCT CGCTCGTGCT GCGGATCGAG 
GATCAGGGGC GGGTGCCCGC CTCGGCCGGA ACCTCGGCCG ACCTCACCAT CTCGATCGAC 
GGAGGCGAGC CGCAGACGGT GCGCGTGCCG GTGGGCGAGG ATCTGGAACT GCCCGTGACG 
CTGCCGCACG GGGGCATGAA CGTCCTCCAG TTCCAGGTGG CGGCCTCGCC GGACGAGTTG 
ACAGACCGCA ACAATTCCGC CGTGGTGCAG ATCAACGGCG TGCGCGACCG GCTGCGGGTG 
CTGCTGGTCT CGGGCGAGCC CCATGCGGGC GAGCGCGTCT GGCGCAACCT CCTGAAGTCG 
GACGCTTCGG TGGATCTGGT GCATTTCACC ATCCTGCGCC CGCCCGAGAA GCAGGACGGC 
ATCCCGGTCT CGGAGCTGTC GCTGATCGCT TTCCCGACCC GCGAACTGTT CGTCGAGAAG 
ATCGAGGAGT TCGACCTCAT CATCTTCGAC CGCTACCGGC TGCGGGGGAT TCTGCCGACC 
TCCTACCTCG AGAATGTGCG GGACTATGTC CGCAACGGCG GCACGGTTCT GGTGGCCGCG 
GGGCCCGAGT TCGGCTCGGC CGACAGCCTC TGGCGTTCGC CGCTGGCGGA CGTGATGCCG 
GTGCAGGCCA CCAGCCGCGT GACCGAGGGC GGCTTCCGCC CGACCCTGAC CGACGTGGGC 
CGCAAGCATC CGGTGACTCA GGGGCTCGAG GCGCAGGCCC CAGAGGGCGG CTGGGGCCGC 
TGGTTCCGCC AGATCGAACT GTCGGCCACC TCGGGTCAGG TGGTGATGAA CGGGGCCGGC 
GACCGGCCGC TCCTCGTGCT CGACCGTGTG GACGAGGGTC GGATCGCCGT GCTCGCCTCG 
GATCAGATCT GGCTCTGGGG GCGGGGCTAC GAGGGGGGCG GGCCGCAGCT CGAACTGCTG 
CGGCGGCTGG CGCACTGGAT GATGAAGGAG CCCGACCTCG AGGAAGAGGC GCTGATCGCC 
GCGGGCGAGG GGGCGCGGAT GACCATCACG CGCCGCACGA TCGGCGAGGA TCCGGGCGAG 
GTGACGATCA CCGGCCCCGA TGGCGCGGAG ACGACGCTTT CCATGCAGGA GACGGCGCCC 
GGCCGCTGGA GCGTCGTATG GGAGGCGCCC GAGATGGGGG TCTACCGGCT GGCCCAGGGC 
GAGCAGAGGG CGGTGATCGC CGTCGGGCCC TCGGCCCCGC GCGAGTTCGA GGAAACGATT 
GCCAGCGGCG ACAGGCTCGC GCCGGTGATC GGGCCGACGA ATGGGGGCAC GCTCCGGCTT 
GAGGAGGGGG CGCCGGACAT CCGTGCGGTC CGCGAAGGAC GGGTGGCGGC GGGGCGGGGC 
TGGATCGGGA TCACCCCGCG CGGCGCCCAT GTCACGCAGG ATGTGCGGGT GGCGGCGCTG 
CTGCCCGGCT GGCTCTACCT GCTGCTGGCC GCGAGTCTGG CCCTCGGTGC CTGGCTGCGC 
GAGGGCCGCT TTGGCCGCAG GGCCTGA

Protein sequence

MTGSVVFDPI LPWAVIWTLA ALGAVMVVLA LWRGLSGWWL RGLALGVLLL ALANPALQEE 
DRAPLSDIVI AVVDESASQR IGDRQAQSAA ALAAVEAEIR ALPDTELRVV RVGDGEGDEG 
SLVMTALAEA LAEEPRARIA GAILITDGQV HDLELAPQMP APLHVLLTGH EEDWDRRLVI 
RNAPAFAILG EPVSLVLRIE DQGRVPASAG TSADLTISID GGEPQTVRVP VGEDLELPVT 
LPHGGMNVLQ FQVAASPDEL TDRNNSAVVQ INGVRDRLRV LLVSGEPHAG ERVWRNLLKS 
DASVDLVHFT ILRPPEKQDG IPVSELSLIA FPTRELFVEK IEEFDLIIFD RYRLRGILPT 
SYLENVRDYV RNGGTVLVAA GPEFGSADSL WRSPLADVMP VQATSRVTEG GFRPTLTDVG 
RKHPVTQGLE AQAPEGGWGR WFRQIELSAT SGQVVMNGAG DRPLLVLDRV DEGRIAVLAS 
DQIWLWGRGY EGGGPQLELL RRLAHWMMKE PDLEEEALIA AGEGARMTIT RRTIGEDPGE 
VTITGPDGAE TTLSMQETAP GRWSVVWEAP EMGVYRLAQG EQRAVIAVGP SAPREFEETI 
ASGDRLAPVI GPTNGGTLRL EEGAPDIRAV REGRVAAGRG WIGITPRGAH VTQDVRVAAL 
LPGWLYLLLA ASLALGAWLR EGRFGRRA