Gene Rpal_5167 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_5167
Symbol
ID	6412867
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	5570293
End bp	5571249
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	66%
IMG OID	642715057
Product	extracellular solute-binding protein family 3
Protein accession	YP_001994130
Protein GI	192293525
COG category	[E] Amino acid transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG0834] ABC-type amino acid transport/signal transduction systems, periplasmic component/domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCTATA AGACCGCCGG TGCGGAACCC CTAATTATGC AACCACAGAT TGCGATGTTG 
ATCAATGGCC GACCGGCCGG CTGGCGCGCA GCCGTGGCGG GCCTGGCGCT CGCCGTGACG 
ACGCTGCTGA CGCCTGGCGC CGCGCGGGCT GCGGAGACCG CGCCCGAGGC GAAGGCGATC 
GCGGATGCGA CGGCGCATGC AGTGCCGGGG TTTTGGGATC CGCGGCGGCG TCCGGAGCGG 
CCGGACATGT CGCGCCTGAC GATGATCCGG TTCCTGACCG AGATCGATTA TCCGCCGTTC 
AACTTCACCG GGGCCGACGG CAATCCGGCG GGGTTCAACG TCGATCTGGC GCGCGCGCTG 
TGCGACGAGA TCAAGATCAC CTGCACGGTG CAGATGCGGA AGTTCGAGAC CCTGCTCGAC 
GCGCTCGCCG GCAATCGCGG CGATGCCATC ATCGCGTCGC TGGCGGTGAC GCCGCAGACC 
CGCACCAAGC TGGACTTCAC CGATCCCTAT TACCGCACGC CGGCGCGCTT CGTCGCCCGC 
AAGGATGCGG TGATGCCGGA GATGCGCCCC GAGTTTCTCG AAGGCCGCAA GGTCGGCGCG 
GTCGCAGGTT CGGCGCATGA GGCCTATCTC AAGGCGATGT TCACGGACGC CGAGCTGCAT 
TCCTATCCGA ATGCCGAGGC GCTGCGTGCC GCGCTGAAGC GCGGCGAGGT GGACTTCATC 
TTCGGCGACG CGATCTCGCT GGCGTTCTGG ATCAACGGCA CCGACTCGGA GAATTGCTGC 
GCGTTCTCCG GCGCCCCGTT CCTGGAGAGC CGCTATTTCG GCGAGGGCGT CGGCATCGCG 
GTGCGCAAGG GCAACGACAC GTTGCGCCAG GCGCTGAATT GGGCGCTGTT CCGGGTTTGG 
GAAAAGGGCC AGTACACCGA CTTGTGGCTC CGGTATTTTT CCGTCAGCCC GTTTTGA

Protein sequence

MVYKTAGAEP LIMQPQIAML INGRPAGWRA AVAGLALAVT TLLTPGAARA AETAPEAKAI 
ADATAHAVPG FWDPRRRPER PDMSRLTMIR FLTEIDYPPF NFTGADGNPA GFNVDLARAL 
CDEIKITCTV QMRKFETLLD ALAGNRGDAI IASLAVTPQT RTKLDFTDPY YRTPARFVAR 
KDAVMPEMRP EFLEGRKVGA VAGSAHEAYL KAMFTDAELH SYPNAEALRA ALKRGEVDFI 
FGDAISLAFW INGTDSENCC AFSGAPFLES RYFGEGVGIA VRKGNDTLRQ ALNWALFRVW 
EKGQYTDLWL RYFSVSPF