Gene Rsph17029_4089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_4089
Symbol
ID	4895000
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009040
Strand	-
Start bp	29991
End bp	31349
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	73%
IMG OID	640110491
Product	hypothetical protein
Protein accession	YP_001041803
Protein GI	126464827
COG category	[S] Function unknown
COG ID	[COG3551] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	96
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	84
Fosmid unclonability p-value	0.180938
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGTCCG ACCAGACCCC TGCCCGCCCA GCCCTTCTCG TCCTCGGAAT GCACCGCTCC 
GGCACCTCGG CCCTCGCGGG CGTGCTCGGC CGGGCGGGCT TCGCGCTGCC GCAGGAACTG 
ATGCCTCCGA CCGAGCACAA TCCGCGGGGC TATTTCGAAT CCACCCGGAT CTTCCGGCTG 
AACGATGCGC TTCTGGCCGC GGCGGGCTCC TCCTGGGACG ACTGGCGGGT CTTCGACGCG 
GACTGGCACC TCTCGCCCGC GGCCGAGCCG TTCCATGCCG AGGCGCAGGA GGCGCTCGCG 
GCGGAATTTC CCGGCACGGC GCCGATCGTG CTCAAGGATC CGCGGATCTG CCGGCTGCTG 
CCCTTCTGGA CCCGCGCGCT GACCGAGGCG GGCTTCCGGC CGCTGGCCGT CTGCACCCAC 
CGCCCCGCGC GCGAGGTGGG CGCCTCGCTC GCGCGCCGCA ACGGCTGGCC CGAGGCGCGC 
GGCCTCCTGC TCTGGCTGCG CCATGTGCTC GATGCCGAGG CCCAGACCCG CGGCAGGCCC 
CGGGTCTTCG TCTCCTACGA CGGGCTGCTC GCGGACTGGC GGGGAACGCT CGGGCGCATC 
GCGGAGGCCT TCGATCTGGC GCTCCCGCGC CCGCTCGACG AGGCCGCGCC CGAGATCGAG 
GCCTTCCTCT CGGCCGACCT GCGCCATGCG CCGGAGACGC CCGCGGCCGC GGCGGGCCTG 
TCCGACTGGA TCGCCCGCCC CGAGGAGATC CTCGACCGGA AGGCCGCCGG AGAGGACCGC 
CCCGGAGACC GCGAGACGCT CGACCGGATC GCGGCCGAAG TCGCCGCCGC GGCCCCCCTG 
CTGGCAGACC TCTCCGGAGC GGTGGAGGAA CAGGGCGCCC GGCTGGAGCG CGAGGCGGCC 
CTGCGCCACG AGGCCCAGAC CATCCTGCAG CAGGAGAGGC AGCGGCTCGA CGACCTGACG 
GCCGAGCTGC AGCTCCAGCT CCATCACAGG ACCCTCCATG TCGCGGAACT GGAGCGTCAT 
GCGGGGGAGC TGGCCCAGCA GCTCAGGCAG AAGACGCAGC ACGAGGCCGA ACTGGAGCGC 
CATGCGGAAG AGCTCGCCCA GCAGCTCCGG CAGCAGAGGT CGCACGCGGC CGAGCTCGAG 
CGCCATGCCG GAGAGCTCTC GGCCCTGACC CACGAGCTGC GCCAGCAGGT GCATCACAAG 
GGCCGGCATG TCCAGGAACT GGAAGCCCAC TCGGGAGACC TCGAAGCGCG GCTTGTCGCT 
CTCGAGGCCG AGCATGCGGC TCTTCTGGGC AGCACCTCCT GGAAGGTCAC GCACCCCCTG 
CGCCGCATGT CGCTGGCCTT GCGTCGTCCG AAGACGTGA

Protein sequence

MTSDQTPARP ALLVLGMHRS GTSALAGVLG RAGFALPQEL MPPTEHNPRG YFESTRIFRL 
NDALLAAAGS SWDDWRVFDA DWHLSPAAEP FHAEAQEALA AEFPGTAPIV LKDPRICRLL 
PFWTRALTEA GFRPLAVCTH RPAREVGASL ARRNGWPEAR GLLLWLRHVL DAEAQTRGRP 
RVFVSYDGLL ADWRGTLGRI AEAFDLALPR PLDEAAPEIE AFLSADLRHA PETPAAAAGL 
SDWIARPEEI LDRKAAGEDR PGDRETLDRI AAEVAAAAPL LADLSGAVEE QGARLEREAA 
LRHEAQTILQ QERQRLDDLT AELQLQLHHR TLHVAELERH AGELAQQLRQ KTQHEAELER 
HAEELAQQLR QQRSHAAELE RHAGELSALT HELRQQVHHK GRHVQELEAH SGDLEARLVA 
LEAEHAALLG STSWKVTHPL RRMSLALRRP KT