Gene RPC_0844 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_0844
Symbol
ID	3969841
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	930803
End bp	931840
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	66%
IMG OID	637923960
Product	ABC transporter substrate-binding protein
Protein accession	YP_530733
Protein GI	90422363
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.317801
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCGAC GAGCTGCACT ATTGACGATG GTGGGTGCCT GCGCCTGGTT GGCCGGCGGC 
GCTGCGCCGC GCGCCGAAGA CGCCGTGACC CTGAAGGTCG GCGTCAACAA GGTGATCAGC 
GACGTGGTAT TCTACATCGC GCAGGAGCGC GGCTTCTTCG CCGAGCAGAA TTTGAAGGTC 
GAACTGATCC CGTTCGACTC CGGGCCGCGG ATGATCGCGC CGCTCGCGGC CGGGCAGATC 
GACATCGGGG CAGGGGCCTC CTCGGCCGGG CTGTTCAACG CGGTCGGCCG CGGCCTCGGC 
GTCAAGATCG TCGCCGACAA GGGCTCCACC GCCGCGGCCT ACGACTACAT GCCGCTGCTG 
CTGCGCAAGG ATCTGATCGA CAGCGGCAAG GTGAAGACGC TGGCCGATCT CAGGGGCCTG 
AAGCTCGCCG CGGCGGGGCC GGGCTCGGCC ACCAACGCCA AGCTCGCGGT GGCGCTCGGC 
AAGGGCGGGC TGACCTACAA GGACGCCGAC AACGTCAATA TGAGCTATCC GCAGCAGGTG 
GTGGCGCTGT CGTCGAAAGC GATCGACGGC GCGATCACCA CCGAGCCATC GGCGAGCCAG 
GCGGTCGACA GCGGCGTCGC GGTGCGGTTC TCCGATGCCT CGCTGTATCC CGGCCAGCAG 
GTCGCGATCC TGCTCTACGG CGCCGAGCTG TTGACCAAGC GCCGCGATGT CGGCCAGCGC 
TTCATGACCG CCTACGTCAA GGCCTCGCGG GTCTACAACG ACGCCACCAA CAAGGGCCTC 
TTCAACGGCC CCGGTTCGCA GCAGCTGATC GATCTGATCA TGAAGACCAC CGGGCTCAGC 
AACCGCAAGC TATTCGACAC CATGGTGCCG AACGGCATCT CGCCGGACGG CGCGGTCAAC 
ATGAAGAGCC TCGCCGACGA TCTGAAGTTC TTCGTCGAGC AGGGCCAAAT CGAAAAGCCG 
GTCGTGGTCG GCGACGTCGT CGACATGGCG TTCGCCAGCA ACGCGGTCAA GCAACTCGGG 
CCGTACCGGC CGAACTGA

Protein sequence

MKRRAALLTM VGACAWLAGG AAPRAEDAVT LKVGVNKVIS DVVFYIAQER GFFAEQNLKV 
ELIPFDSGPR MIAPLAAGQI DIGAGASSAG LFNAVGRGLG VKIVADKGST AAAYDYMPLL 
LRKDLIDSGK VKTLADLRGL KLAAAGPGSA TNAKLAVALG KGGLTYKDAD NVNMSYPQQV 
VALSSKAIDG AITTEPSASQ AVDSGVAVRF SDASLYPGQQ VAILLYGAEL LTKRRDVGQR 
FMTAYVKASR VYNDATNKGL FNGPGSQQLI DLIMKTTGLS NRKLFDTMVP NGISPDGAVN 
MKSLADDLKF FVEQGQIEKP VVVGDVVDMA FASNAVKQLG PYRPN