Gene RPC_1744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_1744
Symbol
ID	3972456
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	1896171
End bp	1897292
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	66%
IMG OID	637924857
Product	hypothetical protein
Protein accession	YP_531622
Protein GI	90423252
COG category	[S] Function unknown
COG ID	[COG5330] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0986789
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATCTGA GAGCCAAGGC TGCTTCCGAA AACCTGCTCG ACGAACTGCA GGACACCCTT 
GCCCATGGCC CGGTGGCGCG CCGGGTGGAA ACGCTGCGCC GCGTCACCGA TCTGTTCGTA 
AGCGGCGCGG TGGACTATTC CGACGAGCAG GTCGCGCTGT TCGACGACGT GTTTGCGTGT 
TTGGTGCGTC ACATCGAGGC CAAGGCGAAG GCCCTGCTGG CGCAGCGCCT GGCGCCGATC 
GCCAAGGCGC CGCCGCGCAT CATCCGTCAT CTGGCATTCG ACGATCTGAT CGACGTCGCG 
GCCCCGGTGC TGACCCAGTC GACGCAACTC GACGACCACG CCTTGATCGA GAATGCCCGC 
AGCAAGAGCC AGGGCCACCT GCTGGCGATT TCCAAGCGGC AGGTGTTGAG CGGAGCGGTG 
ACCGAGGTGC TGGTCGAACT CGGCAACATC GAGGTGGTGC ACAGCACGGT CAACAATCCA 
GGGGCGGAGT TTTCGGCACA AGGCTATTCG ACGCTGGCGT CGCGGGTCGA GATCGACGAC 
ACGCTGTCGG CGCTGATCAG CATGGTGTCG TCGATCCCGC GGCATCACTA CCTGAAATTG 
ATCGCCAAGG CCTCGGTGTC GGTGCGCAGC CGGCTGGAGG CCGCGCATCC GCAGGAGGCG 
AACGAGATCG CAACCGCGGT CCGCGAAGCC TCGCGGCGCG CCCGGCTGGC GCCGGCGGCG 
ATGAGCAAGG AAACCGTGAT CGCCCACGGC CTGGTGCGCG CGCTATACGA GGACGGCAGG 
CTCGACGAAA AGCTGGTCGG CAACTTCGCC GAGGAAGGCA AGTTCGACGA GACCAACGCC 
GCGATCGCCT GCATGGCCAA CGTCACGGTA TCGGTCGCCG AGTCCATAAT GATCGAATCC 
CGGGCCGAGG GCGTGCTGAT CTTGGCCAAG GTCGCCGGAC TGACGTGGTC GACGGTGCGC 
GCGATCATCA GTCTGCGCGA CGAATTGTCC GGCATGAAGA GCGCCGACAT CGAGGCCTGC 
CGGCTGACCT ACGAGCAATT GCGGCCGAGC ACGGCGCAGC AGGTGCTGCG CTTCCACCGG 
ATGCAGCAGG AAACCGGCAG CACCGCCGCG CCTCCGACCT GA

Protein sequence

MHLRAKAASE NLLDELQDTL AHGPVARRVE TLRRVTDLFV SGAVDYSDEQ VALFDDVFAC 
LVRHIEAKAK ALLAQRLAPI AKAPPRIIRH LAFDDLIDVA APVLTQSTQL DDHALIENAR 
SKSQGHLLAI SKRQVLSGAV TEVLVELGNI EVVHSTVNNP GAEFSAQGYS TLASRVEIDD 
TLSALISMVS SIPRHHYLKL IAKASVSVRS RLEAAHPQEA NEIATAVREA SRRARLAPAA 
MSKETVIAHG LVRALYEDGR LDEKLVGNFA EEGKFDETNA AIACMANVTV SVAESIMIES 
RAEGVLILAK VAGLTWSTVR AIISLRDELS GMKSADIEAC RLTYEQLRPS TAQQVLRFHR 
MQQETGSTAA PPT