Gene Rsph17025_4057 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_4057
Symbol
ID	5086230
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009430
Strand	+
Start bp	100711
End bp	101910
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	75%
IMG OID	640485620
Product	hypothetical protein
Protein accession	YP_001170214
Protein GI	146280057
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.058101
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.267304
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGCTGA TCCTCGGCCT TGCGCTGCGC GACCTGTGGC GGGACTGGGC GCGGCTGGTC 
TGCAACATCG CCGTGATGGC GGGCGTCCTC GTGCCGCTCC TCGTGCTGTT CGGGGTGCGC 
AACGGCGTCT ATGAGGCGCT GCTGGGCCAG CTCCTGCGCA ATCCGGCGGC GCTGCAGATC 
GACACGCGCG GCAATTCCGC CTTCACTCCG GCAGATGCCG AGGAGGTCCG CGGCTGGCCC 
GAGACCGCCT TCGTCACGCT GAAGACCCGG AGCCTCTTCG ACTATGTCAA CGTCCGGCCC 
GCGGGACAGC CCGCGGTGCG CGAGGCGGTC GCGGTGCCGA CGGGGGCGGG CGATCCGATG 
CTGGCGCCGC TGCCGGGCCT CGGGGCGGAC GAGATCGCGG TCTCGGCGCC GCTGGCCGCG 
CAGCTCGGCC TCGGGCCGGG GGACGCGGTC GAGCTGGTGA CCCAGGCGCC CGAGAGGCCG 
CGCCAGCTGG TCCTGGCCCG CCGGATCGGG ATGATCCTGC CCGAGGCGCG CGCCGCGGGG 
CGGGCGGTGC TGGCCGATCT CGGGACGCTC GACCTGATCG AGGCCTTCTA CGACGAATAT 
GCCCTGCCCG AGCACGGGAT CGCGACGGGC CGCCCGCTCG CGGGGCGGGT CGCCGATTAC 
GAGGGGATGC GCGCCTATGC CGCCTCGCTC GAGGCGCTGG CGCCGCTGCA GGCGCGGATG 
GAGGCGCGGT TCGGCGTGGC GACCGAGGCG CAGACGGCCC GGGTGACGGG GGTGCTGGGC 
CTCGGGCGGA ACCTCGGCCT TGCGCTTGCC CTGACGGCGG TGGTGGCGGG GACGGGGCTG 
GCGGCGGCGC TCGTCTTCGG CTTCTGGGCC GAGGTGGCGC GCAAGCGGCA CATGCTGGCG 
GGCCTTGGCC TGATCGGCCT GCCGCCGGCG GCGCTGGGGC TCATTCCGAT GGTGCAGGCG 
CTGGTGACGG CCCTCTTGGG CCTCGCGGTC TCCTTCGCGC TCTTCGCGGT GGCGGGGGCG 
GTGGCCGAGC GCCTCTTCGC CAGCGGTCTG ACCGAGGAGG GCGGCCTCGT GCGGCTGGCG 
CCCGGGCAGG GGCTTGCCAT CGCGGGCGGG GTGGTGATCC TCGTGACGGC CTCGGCGCTG 
GCGGCCGCGC GGGCGGCGCT GCGGACCGAT CCGGCCGTCG TGCTGCGCGA GGCGCCATGA

Protein sequence

MRLILGLALR DLWRDWARLV CNIAVMAGVL VPLLVLFGVR NGVYEALLGQ LLRNPAALQI 
DTRGNSAFTP ADAEEVRGWP ETAFVTLKTR SLFDYVNVRP AGQPAVREAV AVPTGAGDPM 
LAPLPGLGAD EIAVSAPLAA QLGLGPGDAV ELVTQAPERP RQLVLARRIG MILPEARAAG 
RAVLADLGTL DLIEAFYDEY ALPEHGIATG RPLAGRVADY EGMRAYAASL EALAPLQARM 
EARFGVATEA QTARVTGVLG LGRNLGLALA LTAVVAGTGL AAALVFGFWA EVARKRHMLA 
GLGLIGLPPA ALGLIPMVQA LVTALLGLAV SFALFAVAGA VAERLFASGL TEEGGLVRLA 
PGQGLAIAGG VVILVTASAL AAARAALRTD PAVVLREAP