Gene Rpal_1571 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_1571
Symbol
ID	6409228
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	1679823
End bp	1680887
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	63%
IMG OID	642711463
Product	putative sulfate ester transporter, periplasmic binding component
Protein accession	YP_001990578
Protein GI	192289973
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTTGCG CGTTGCGGCT GTCCGCGGTT GTGCTGTTTG TTGGTGCTCT GTGGTCTTCG 
GCGTTTGCGG CGGAGCCAGT GACGATCCGC ATCGGCACGC CGGATCAGAG CGCCGGGCCG 
ACGCCGTCCG GCGGCATGGG GATCGTCACC TACATCGCCG GCAAGCAGTT ACTCGAGCAG 
GAGTTCGCCA AAGACGGCAT CAAAGTCGAA TGGACGTTCT TCAAGGGTGC CGGTCCCGCG 
GTCAACGAAG CACTGGCGAA TAAGCAGCTC GATGTCGTCT ATCTTGGCGA CCTCGCCGCG 
ATTATCGGCC GCGCCAACGG TCTGGCGACG CGCTTCCTGG TGCCGGTGCG CGGCAACAAT 
GCTTACCTCG CGGTACCACT CGACTCCGAC GTCAAGAAGG TCGAGGACCT CAAGGGTAAG 
CGTGTCACCG TGTTTAAGGG GACTGCCTAT CAGCTCGTGC TCGATCGGGC GCTGGCCAAA 
GCGGGGCTGA GCGAGCGTGA TCTGCAGGTC GTCAACCTGG ATTGGAGCGC GGCGTCGGCT 
GCGCTAGCCG CCAAGCAGCT CGACGGCAAC TGGGCCGGCT TGCAGGCGGT GACGCTGCAG 
GAAAAGGGGC TGGCGCGGAT CGCGCTGAGC GCTCGCGATC TAGGCCGCGA GTTCACGGTT 
CAGAGCGGAT TCCTCGCCCG GGAGGAATTC ATCGCGGCAC ATCCCGATCT CGTCCAACGG 
CTCGTCACTG TGGTGGTCAA GGCACAGCGC GATCTGTCGC AGTCGGACCA CCTCGAGGAT 
TTCATCATCT TTGCGTCGCA GCGCTCCGGC ATTCCGGCCT CGCTCGGCCG CACCGAATAC 
GGCGGAGAGG ATCTGAAGTT TCGGTTCTCG CCGTTGATCG ACGAGTTCGT CATCGACGGG 
CTTCGCGTTG GCGTCGAGCA GGCGAAGGAA CTGAACCTGG TCCGAAAGAC TTTCGACGTC 
GGCCCGTGGT TTGAGCCGAG GTTCGTCGAC AAGGCGGTCG AAGACCTCGG GCTGAAGAGC 
TACTGGCCGC GTTACGACAA ATCCGGGCAG CCGCTGGGGC AATGA

Protein sequence

MFCALRLSAV VLFVGALWSS AFAAEPVTIR IGTPDQSAGP TPSGGMGIVT YIAGKQLLEQ 
EFAKDGIKVE WTFFKGAGPA VNEALANKQL DVVYLGDLAA IIGRANGLAT RFLVPVRGNN 
AYLAVPLDSD VKKVEDLKGK RVTVFKGTAY QLVLDRALAK AGLSERDLQV VNLDWSAASA 
ALAAKQLDGN WAGLQAVTLQ EKGLARIALS ARDLGREFTV QSGFLAREEF IAAHPDLVQR 
LVTVVVKAQR DLSQSDHLED FIIFASQRSG IPASLGRTEY GGEDLKFRFS PLIDEFVIDG 
LRVGVEQAKE LNLVRKTFDV GPWFEPRFVD KAVEDLGLKS YWPRYDKSGQ PLGQ