Gene Rpal_0833 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_0833
Symbol
ID	6408486
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	879448
End bp	881046
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	62%
IMG OID	642710746
Product	extracellular solute-binding protein family 5
Protein accession	YP_001989866
Protein GI	192289261
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.54369
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGACTTA AGAGTTCATG GGTGCTGGGC GCGTTGTTTG CTGCGGCGAG CGCAATCGGT 
GCGGCGCGTG CGGAAACAGT GGTGCGTTAC GGGATCTCGA TGGCCGATAT TCCGCTGACC 
ACGGGGCAAC CGGATCGCGG CGCCGGCGCG TATCAGTTCA CCGGCTACAC GATCTATGAT 
CCGCTGGTGG CGTGGGAGAT GAACGTCGGC GATCGGCCCG GCAAGCTGGT GCCGGGGCTC 
GCCACCGAAT GGAAGGTCGA TGATGCCGAC AAGACCAAGT GGCGCTTCAC CTTGCGCAAG 
GGCGTCAAGT TTCACGACGG CAGCGACTTC AACGCCGATG CGGTGATCTG GAATCTCGAC 
AAGGTTCTCA ACGACAAGGC GCCGCAATTC GACAAGCGCC AGAGCGCGCA GGTGAAGACC 
CGGCTGCCGT CGGTGAAGAG CTACGCCAAG ATCGACGATT CCACCGTCGA GATCACCACC 
AAGACGGTCG ACTCGTTCTT TCCCTATCAG ATGCTGTGGT TCCTGGTGTC GAGCCCGGCG 
CAGTATGAGA AGGTCGGAAA GGACTGGGAT AAGTTCGCCG CCAATCCGTC GGGCACCGGT 
CCCTTCAAGC TCACCAAGCT GGTGCCGCGC GAGCTCGCCG AGCTCACCAA GAACGATGAG 
TATTGGGACA AGTCGCGGCT GCCGAAGACC GACAAGCTGG TGCTGATCCC GATGCCTGAA 
GCGTTGACCC GCACCAATGC ACTGCTGGCC GGGCAGGTCG ATCTGATCGA GACGCCTGCG 
CCCGACGCGG TGCCGCAGCT CAAGGCGGCC GGCATGAAGA TCGTCGACAA CGTCACACCG 
CACGTCTGGA ACTATCACCT CAGCGTGCTG CCCGGCTCGC CCTGGACCGA CGTGCGCCTG 
CGCAAGGCGC TCAATCTCGC GATCGATCGC GAGGCGGTGG TCGGACTGAT GAACGGCCTC 
GCCAAGCCGG CGGTCGGACA GGTCGATCCG TCGAGCCCGT GGTTCGGCAA TCCGTCGTTC 
AAGATCAAAT ACGATCTGGC GGAAGCCAAG AAGCTGGTGA AGGAAGCCGG CTATTCGCCG 
GAGAAGCCGC TGAAGACCAC CTTCATCATT GCCAATGGCG GCACCGGCCA GATGCTGTCG 
CTGCCGATGA ACGAGTTCCT GCAGCAGAGC TTCAAGGAGA TCGGCATCGA CGTCGAGTTC 
AAGGTGGTCG AACTCGAAGT GCTGTACACC GCGTGGCGCA AGGGGGCGGC CGATGAATCC 
AACGCCGGCA TCACCGCCAA CAACATCGCC TACGTCACCT CCGATCCGCT GTATGCGATC 
GTGCGGTTCT TCCATTCCGG GCAGGTGGCG CCGGTCGGCG TCAACTGGGG CGGCTACAAG 
AATCCGAAGG TGGATGCGCT GATCGACGAC GCCAAGACCA CGTTCGAGCC GAAGAAGCAG 
GACGAACTGC TGGCGCAGGC GCACTCGCTG ATCGTCGACG ACGCAGCGCT GGTGTGGGTG 
GTGCACGATA CCAATCCGCA CGCGCTGTCG CCGAAGGTGA AGAGCTTCGT GCAGGCCCAG 
CACTGGTTTC AGGACCTGAC CACGATTGGG CTGCAGTAA

Protein sequence

MRLKSSWVLG ALFAAASAIG AARAETVVRY GISMADIPLT TGQPDRGAGA YQFTGYTIYD 
PLVAWEMNVG DRPGKLVPGL ATEWKVDDAD KTKWRFTLRK GVKFHDGSDF NADAVIWNLD 
KVLNDKAPQF DKRQSAQVKT RLPSVKSYAK IDDSTVEITT KTVDSFFPYQ MLWFLVSSPA 
QYEKVGKDWD KFAANPSGTG PFKLTKLVPR ELAELTKNDE YWDKSRLPKT DKLVLIPMPE 
ALTRTNALLA GQVDLIETPA PDAVPQLKAA GMKIVDNVTP HVWNYHLSVL PGSPWTDVRL 
RKALNLAIDR EAVVGLMNGL AKPAVGQVDP SSPWFGNPSF KIKYDLAEAK KLVKEAGYSP 
EKPLKTTFII ANGGTGQMLS LPMNEFLQQS FKEIGIDVEF KVVELEVLYT AWRKGAADES 
NAGITANNIA YVTSDPLYAI VRFFHSGQVA PVGVNWGGYK NPKVDALIDD AKTTFEPKKQ 
DELLAQAHSL IVDDAALVWV VHDTNPHALS PKVKSFVQAQ HWFQDLTTIG LQ