Gene Rpal_5002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_5002
Symbol
ID	6412694
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	5386295
End bp	5387242
Gene Length	948 bp
Protein Length	315 aa
Translation table	11
GC content	64%
IMG OID	642714885
Product	TRAP transporter solute receptor, TAXI family
Protein accession	YP_001993966
Protein GI	192293361
COG category	[R] General function prediction only
COG ID	[COG2358] TRAP-type uncharacterized transport system, periplasmic component
TIGRFAM ID	[TIGR02122] TRAP transporter solute receptor, TAXI family

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.117483
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGCCA GATTGTTTGG TGTCGCCGCG GCTGCGGTCA TTGTCCTGGC GGCGCCGCAA 
GCCCGCGCTC AGCAGTTCGT CAACGTGCTG ACCGGCGGCA CCTCCGGCGT CTACTATCCG 
CTCGGCGTCG CGATAGCCAA GATTTATGGC GAGAAGATTC CCAACGTCAA AGCTCAGGTC 
CAGGCCACCA AGGCATCGGT CGAGAACCTC AACCTGCTGC AGCAGGGGCG CGGCGAGATC 
GCGTTCTCGC TCGGCGACTC GCTGAAAGCT GCCTGGGACG GCGACGCCGA AGCCGGCTTC 
AAAGCCAAGC TCGACAAGTT GCGGGTGATC GGCGCGATCT ATCCGAACTA CATCCAGATC 
GTTGCGACGT CCGAAAGCGG GATCAAGACG CTCGCCGACC TGAAGGGCAA GAGCCTGTCG 
GTCGGCGCGC CGAAATCCGG CACCGAGCTG AATTCGCGCG CGATCCTGAA GGCCGCCGGC 
ATGGACTACA AGGATCTCGG CAAGATCGAA TATCTGCCGT TCGCCGAATC CGTCGACCTG 
ATGAAGAACC GCCAGCTCGC CGCCACGCTG CAGTCGGCCG GCCTCGGCGT CGCCTCGTTG 
AAGGACCTGT CGAACTCGTC CGACATCAAC GTCGTGGCGG TGCCGAAGGA GGTCGTCGAC 
AAGATCGGCC CGCCGTTCGT CGCCGAGACC ATCCCGGCTG GCACCTATAA GGGGCAGGAC 
AAGGACGTGC CGACCGCCGC GGTGATCAAC TATCTGGTGA CCTCGAGCGC CGTGTCCGAC 
GACCTGGCGT ATCAGATGAC CAAGCTGATC TACGAATCGC TGCCCGAACT CGCCAGCGCC 
CACGCCGCCG GCAAGGGCAT CAAGCTCGAA ACCGCCGCCG CCGGCAGCCC GGTCCCGCTG 
CACCCCGGCG CGATCAAGTA TTTCAAGGAA AAGGGCGTGC TGAAGTAG

Protein sequence

MKARLFGVAA AAVIVLAAPQ ARAQQFVNVL TGGTSGVYYP LGVAIAKIYG EKIPNVKAQV 
QATKASVENL NLLQQGRGEI AFSLGDSLKA AWDGDAEAGF KAKLDKLRVI GAIYPNYIQI 
VATSESGIKT LADLKGKSLS VGAPKSGTEL NSRAILKAAG MDYKDLGKIE YLPFAESVDL 
MKNRQLAATL QSAGLGVASL KDLSNSSDIN VVAVPKEVVD KIGPPFVAET IPAGTYKGQD 
KDVPTAAVIN YLVTSSAVSD DLAYQMTKLI YESLPELASA HAAGKGIKLE TAAAGSPVPL 
HPGAIKYFKE KGVLK