Gene Rpal_0136 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_0136
Symbol
ID	6407779
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	149123
End bp	150115
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	69%
IMG OID	642710045
Product	ABC transporter substrate-binding protein
Protein accession	YP_001989174
Protein GI	192288569
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.778502
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGCCGC CACAGCATCT GATCCCCACT CGGCGCGATG TGGTGCGCGG CCTTGCGGCG 
CTGCCGGCGC TGGGGTTGAC GCGGACGTTC GCCGCCGAGC CACTGACGCT GTGGGGGATT 
CCGGCGACGC CGTCGGCGCT GTTCGTCCGC GCCGTGGCGT CGGAACAGCT GCAGCAGGCC 
GCGCCCGGGA TCCGCTTTCA GCTCTGGAAG AGCACCGACC AGATGCGCGC CGGGATCGCG 
TCGGGACAGT TTCGGCTGTT TGCGACTTCG ACCTACGCGG CCGCCAATTT CTTCAATCGC 
GGCGCCGGGA CGCGCATGCT GAATGTCGTC ACCTGGGGTG TGCTCTACGT GATGGCGCGC 
GATCCGGCCA TCAGGTCGGT CGCCGATCTC GCCGGCCGCA GCATTCTGCT GTCGAACAAG 
AACGAAGCGC CCGATCTGTT GTTTCGGCTG GTGCTGCGCT GGGCCGGGCT CGATCCGGAC 
CGCGACGTCC GCTGCGAATA TGTCGGCTCG CCGGGCGAGG CGGTGCCGCT GTTTCTCGCC 
GGCCGCAGCG ACGTCGCCGT GCTGCACGAA CCCGCCGCCA CCACCGCGCT GCTACGCGCC 
AAGCAGGAGG GAAAGCCGGT GTACCGAGTA TTGGACATCG CCGAACTGTA CGGCCGCCAC 
GCTGGGCGAG GACCGCGGAT TCCGCAGGTC GGGCTTGCGG TCAGCGCCGA CCTGCTGGAT 
ACCCAGCCCG GGCTCGTCGC TGCGGTGCAG GCCGCCTGCG TCGAGGCGAG CACCTGGATC 
GCCGCGCATC CTGCAGAGGC CGCCGAGCTG GCCGCGCCGG CGCTCGGCCT GCCTGCCGAA 
GTAATCGCGG CATCGCTGCC GCATGTCCGC CTCGACGTTG TTCCGGCGCG GCAGGCGCGT 
GACGACATCG AAATGTACTT CAAGAATTTG ATGGAGCTCG ATCCCGGCAT CGTCGGCGGC 
CGGCTGCCGG ACGCGGCGTT CTATGCGGGG TAG

Protein sequence

MSPPQHLIPT RRDVVRGLAA LPALGLTRTF AAEPLTLWGI PATPSALFVR AVASEQLQQA 
APGIRFQLWK STDQMRAGIA SGQFRLFATS TYAAANFFNR GAGTRMLNVV TWGVLYVMAR 
DPAIRSVADL AGRSILLSNK NEAPDLLFRL VLRWAGLDPD RDVRCEYVGS PGEAVPLFLA 
GRSDVAVLHE PAATTALLRA KQEGKPVYRV LDIAELYGRH AGRGPRIPQV GLAVSADLLD 
TQPGLVAAVQ AACVEASTWI AAHPAEAAEL AAPALGLPAE VIAASLPHVR LDVVPARQAR 
DDIEMYFKNL MELDPGIVGG RLPDAAFYAG