Gene RPC_3110 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_3110
Symbol
ID	3972966
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	3452043
End bp	3453218
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	69%
IMG OID	637926219
Product	hypothetical protein
Protein accession	YP_532971
Protein GI	90424601
COG category	[S] Function unknown
COG ID	[COG5330] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.549538
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGTTC GGCAGTTCAT CAGTTGGATC CGCACCGCCC CCGCGGGCGA GCGCGCCGAG 
GCCACCCGCT CGTTGGCGCG GGCCTGGCTG GTTTCAGACC TTTCCGACGC CGATCGCGCG 
GCCGCCGAAG GCGCGCTGTT GATGCAGCTC GACGATTGTT CGCCCTTGGT GCGACTGGCG 
ATGTCGGAAG TGTTCGCGCG CAGCGCCGAT GCGCCGGCCT CGATCATTCG CGCGCTGTCC 
ACCGATCAGG CCAGCGTCGC GGTGCCGGTG CTGGAATTCT CCCCGTTGCT GATCGATGCC 
GACCTGGTCG ATATCGTCGC CACCGGCAAT TGCCAGATGC AGTGCGCGAT CGCGCGTCGC 
GCCGCGTTGC CGGCGTCGGT GTGCGCCGCC ATCGCCGAGG TCGGCTCGCC GTCGGCGGCG 
CTGGAACTGA TCGAAAACCC GCACGCCGAA TTGGCGCCGT TTTCCTGGGA CCGCATCGTC 
GAGCGCCACG GCCATCTGGC GGCGATCCGG GAATCGATGC TGGTGCTGGA AGATCTGCCG 
GCCGCGACGC GGTTGGCGCT GGTCGGCAAA CTGTCCGATA CGCTGGCGCA ATTCGTGGTG 
GCGCGGCGCT GGCTCAGCGC CGATCGCGCC GAGCGCGTCG TCGCCGAGGC GATGGATCGC 
TCCACGGTGG CGATCGCGGC GCGCTCGCGC GACGACGACA TGCGCGGCCT GATGCAGCAT 
CTGCGCGCCA CCGGACAACT CACCGCCGGC CTGATCCTGC GCGCGCTGTT GTCCGGCAAT 
CTCGAACTGT TCCATCAATC GCTGGTGGAA TTGACCGACT TGCCATACGG CCGCGTCGCC 
GCGCTATTGC ACGATGGCGC CAGCGCCAGC CTGAATGCCT TGCTGATCCG CGCCGGCCTG 
CCGGAATCCA CCTTCCCGGC GTTCCGCGCC GCGCTCGAGG CCGCGCAGCA ACTCGGTTTT 
GCCGACAGCA CCGACGGCGC GGCGGGGCTG CGCCGGCGCA TGGTTGAACG GGTGCTGACT 
CACTGCGAGA CCGGCAGCGA TGCCGCGGGG CCGTTGCTGA TCCTGCTGCG GCGCTTCGCC 
ACCGAATCCG CCCGCGACGA GGCCAGCCGC TATTGCGACG ACGTGCTGGC GGAGGACTGG 
GTGGCACGGT TCGAATGGGC GGCGATGGCC GCCTGA

Protein sequence

MIVRQFISWI RTAPAGERAE ATRSLARAWL VSDLSDADRA AAEGALLMQL DDCSPLVRLA 
MSEVFARSAD APASIIRALS TDQASVAVPV LEFSPLLIDA DLVDIVATGN CQMQCAIARR 
AALPASVCAA IAEVGSPSAA LELIENPHAE LAPFSWDRIV ERHGHLAAIR ESMLVLEDLP 
AATRLALVGK LSDTLAQFVV ARRWLSADRA ERVVAEAMDR STVAIAARSR DDDMRGLMQH 
LRATGQLTAG LILRALLSGN LELFHQSLVE LTDLPYGRVA ALLHDGASAS LNALLIRAGL 
PESTFPAFRA ALEAAQQLGF ADSTDGAAGL RRRMVERVLT HCETGSDAAG PLLILLRRFA 
TESARDEASR YCDDVLAEDW VARFEWAAMA A