Gene Rsph17025_3025 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_3025
Symbol
ID	5084364
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	-
Start bp	3096355
End bp	3097863
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	71%
IMG OID	640484596
Product	hypothetical protein
Protein accession	YP_001169214
Protein GI	146279055
COG category	[C] Energy production and conversion
COG ID	[COG3488] Predicted thiol oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0498706
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCGTC TGCCTGCCCT GCTGGTGATC ATCGCCTTTC CCGCCGCGGC CGAGCCTCTG 
GATCCGCCGA ACCTGACCAT CCTGCCCCGC ACGGCCGCCG AGACCGCCCG GATTGCGGCC 
GTTCTCGCAC CGCCCGTCGA TTTCTCGAAG CCCGAGCCCT TCGAGGCGCT GCCCGGCGGC 
GCGGCCAGCG TGCGCGCCCG CGACACGGCC GACGCCTTCT CGCAATCCTC GGGCAACATG 
CCGTTCGAGC GCGAGATGGA TTTCAAGCTC GGCAACGGGC TGTTCCGCAA GCTGTGGGTG 
GCGGCCCCCT CCTCGACGCA GGCCTCGGAC GGGCTCGGCC CGCTCTACAA CGCCCGCGGT 
TGCCAGAACT GCCACCTGAA GGACGGCCGC GGCCATGTGC CCGAGGGGCC CGAGGATGAG 
GCGGTCTCGA TGTTCCTGCG CCTTTCCGTC CCCGGCGGTC CCTCTCCCGA GGGCATCGAG 
GAGTGGATCG CCACCAGCGC CGAACCCACC TATGGCGGGC AGCTTCAGGA CTTTGCCGCC 
CCCGGTCTGG CACCCGAGGG CCGGATGCGG ATCGACTGGC AGGAGCTGCC CGTCACGCTC 
GATGACGGCA CGGTGGTGAC GCTGCGCAAG CCCGACTACT CGGTCGAGGA TCTGAATTAC 
GGCCCGATGG CAAGGGATGT GATGCTCTCG CCCCGCGTCA CGCCGCAGAT GATCGGGCTG 
GGGCTGCTCG AGGCCATTCC GGCCGCCGAC ATCCTGGCCC ACGCCGACCC CGAGGATCGG 
GACGGCGACG GCATCTCGGG CCGCCCCAGC ATCACCTGGT CGGCCGAAGC GGATGCGCCG 
ATGCTCGGCC GGTTCGGCCT CAAGGCGGGG ACGCCCACGG TGCTGCAGCA GTCCGCCTCG 
GCCTTCGCCG GTGACATGGG GATCGCGAAC GCCCTCTTCC CCGAGCCCTG GGGCGAATGC 
ACCGAGGCGC AGACCGCCTG CCGCGCCGCG GTCCACGGGA TCGAGCCAGG CAAGCGCGAC 
GGTCTCGAGA TCGACCGGCA GGGGCTCGAA CTGACGACGT TCTACGCCCG CAACCTCGCC 
GTGCCCGAGA GGCGCCGGGT GGACGATCCG CAGGTGCTGC GCGGCAAGCA ACTCTTCCAC 
GAGGCGGGCT GTCCCGCCTG CCATGTGCCC AAGTTCGTGA CCCACCGGCT GAAGGACCAG 
CCCGAGCAGA GCTTCCAGCT GATCTGGCCC TACACCGATC TGCTGCTGCA CGACATGGGC 
GAGGGGCTGG CGGACGGCCG CCCCGAGGGT CGGGCCACGG GTCGCGAGTG GCGCACCGCG 
CCGCTCTGGG GCATCGGCCT GACCGAGCAG GTGAGCGGCC ACGCCAACTT CCTGCACGAT 
GGCCGTGCGC GGACGATCCT CGAGGCAATC CTCTGGCACG GCGGCGAAGC CGAGGCCGCC 
CGCGCGCGCG TCATGGCCCT GCCCGCCCCC GACCGCGCGG CCCTCATCGC CTTCGTGGAG 
GATCTCTGA

Protein sequence

MSRLPALLVI IAFPAAAEPL DPPNLTILPR TAAETARIAA VLAPPVDFSK PEPFEALPGG 
AASVRARDTA DAFSQSSGNM PFEREMDFKL GNGLFRKLWV AAPSSTQASD GLGPLYNARG 
CQNCHLKDGR GHVPEGPEDE AVSMFLRLSV PGGPSPEGIE EWIATSAEPT YGGQLQDFAA 
PGLAPEGRMR IDWQELPVTL DDGTVVTLRK PDYSVEDLNY GPMARDVMLS PRVTPQMIGL 
GLLEAIPAAD ILAHADPEDR DGDGISGRPS ITWSAEADAP MLGRFGLKAG TPTVLQQSAS 
AFAGDMGIAN ALFPEPWGEC TEAQTACRAA VHGIEPGKRD GLEIDRQGLE LTTFYARNLA 
VPERRRVDDP QVLRGKQLFH EAGCPACHVP KFVTHRLKDQ PEQSFQLIWP YTDLLLHDMG 
EGLADGRPEG RATGREWRTA PLWGIGLTEQ VSGHANFLHD GRARTILEAI LWHGGEAEAA 
RARVMALPAP DRAALIAFVE DL