Gene Rsph17029_0049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_0049
Symbol
ID	4896923
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	58771
End bp	59991
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	73%
IMG OID	640110625
Product	hypothetical protein
Protein accession	YP_001041941
Protein GI	126460827
COG category	[S] Function unknown
COG ID	[COG3214] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.130826
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCCTCC CCAACCCGCT CGCCCGCCGG CTGTTCCTGC ATCTCCACGC CCTTGCCGAG 
CCGCCCACCG GCCCGGCCAA GGGCGAGGCG CTGCTGGCGC TGATCGACCG TCTGGGCTTC 
GTCCAGATCG ACAGCATCTC GACCGTCGCC CGCGCCCATC ACATGATCCT CTTCGCGCGC 
AGGCAGGCCT ACCGGCCCGA GGCGCTCGAC CGGCTGCTCG CGCAGCGCCA CCTGTTCGAA 
CACTGGACCC ACGATGCGGC GGTGATCCCC GCCCGCTTCT TCCCCTTCTG GCACCACCGC 
TTCCGCCGCG ACCGGCCGCG GCTGCTGGCC CGCTGGCGCG GCTGGCAGCG CGAGGGGTTC 
GAGGAGCAGT TCGATGCGGT CCTCGCGCGG ATCGCCGAAA GCGGGCCGGT CTCGGCCGCC 
GAAGTGGGCG AGGAGGAAGA GCGCGGCACA GGCGGCTGGT GGGACTGGCA CCCGTCGAAG 
GCCGCCTTGG AATATCTCTG GCGGGTGGGC GAGCTTTCCA TCACGCGCCG CGACTCGTTC 
CGCAAAGTCT ACGATCTGAC CTCCCGCGTC ATCCCGTCCG GGTGGCTCGC GATGGATCCG 
GGCGACGCCG CCACGATCCA CTGGGCCTGC TCCGAGGCGC TCGACCGGCT GGGCTTCGCC 
ACCTCGGGCG AGCTGGCCGC CTTCTGGGCC GCCGCCAGCC CCGCCGAGGC GCAGGCCTGG 
TGTCACGATG CGCTCGCGCG CGGCGAGATC GTGGAGGTCC GCGTCGAGGG GGCCGACGGC 
AGCCTCCGGC GCAGCTACGC CCGCCCGGAG GTGGCCGCGC TGGCCGAGGC CGCGCCCGAT 
CCCTCGCCGC GGCTGCGGAT CCTGTCGCCC TTCGATCCGG TGCTGCGCGA CCGGGCCCGC 
GCCGAACGGC TGTTCGGCTT CCGCTACCGG ATCGAAGTGT TCGTGCCCGA GGCCAAGCGC 
ACCTACGGCT ATTACGTTTT CCCGATCCTC GAGGGCGACC GGCTGATCGG CCGGATCGAC 
ATGCGCGCCC ACCGCGAGAG CGGCAGCCTG CGCGTGCGCG CGCTCTGGCC CGAGCTGGGG 
GTGCGGCTCG GCTCGCGGCG GCTCGGGCGG CTCGGGGCCG AGCTCGACCG TCTGGCGCAG 
TTCGCGGGCT GCGATCAGGT GAAGTTCGAG CCGGACTGGC TGCGCGAGAC GCTGCCCGAG 
GGGAGCGTCG CCGGAGACTA G

Protein sequence

MILPNPLARR LFLHLHALAE PPTGPAKGEA LLALIDRLGF VQIDSISTVA RAHHMILFAR 
RQAYRPEALD RLLAQRHLFE HWTHDAAVIP ARFFPFWHHR FRRDRPRLLA RWRGWQREGF 
EEQFDAVLAR IAESGPVSAA EVGEEEERGT GGWWDWHPSK AALEYLWRVG ELSITRRDSF 
RKVYDLTSRV IPSGWLAMDP GDAATIHWAC SEALDRLGFA TSGELAAFWA AASPAEAQAW 
CHDALARGEI VEVRVEGADG SLRRSYARPE VAALAEAAPD PSPRLRILSP FDPVLRDRAR 
AERLFGFRYR IEVFVPEAKR TYGYYVFPIL EGDRLIGRID MRAHRESGSL RVRALWPELG 
VRLGSRRLGR LGAELDRLAQ FAGCDQVKFE PDWLRETLPE GSVAGD