Gene Rpal_5036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_5036
Symbol
ID	6412730
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	5418043
End bp	5419068
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	65%
IMG OID	642714921
Product	TRAP dicarboxylate transporter- DctP subunit
Protein accession	YP_001994000
Protein GI	192293395
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGACAA GCGTGGCTTG GGCGGTGGCG TTGTCGCTGC CGGTGACGAT GGCTTTGGCG 
CCTGCTCAGG CGCTCGAACT CAAGGTTGCC GACTCATTTC CCGCCGGGCA CTACCTCGTC 
CGCCTGATGT TGAAGCCGTG GATGGACGAC GTCACCAAGC GCACCAACGG CGCGGTGACC 
TTCAGCTATT ATCCCAACCA GCAGATGGGC AAGGCCACCG ATCTGTTGCG TCTGACCCAG 
TCGGGCGTCG TCGACATCGG CTACATCGCC CCGTCCTACG CCTCCGACAA GATGCCGCTG 
TCCGAAGTGG CGCAACTGCC GGAGTCGTTC ACGACGAGCT GCCAGGGCAC GATGGCCTAT 
TGGAAGAGCG CGCGCGACGG CGTGCTCGCC AGGCAGGAAT ACGCGCCCAA CAAGATCAAG 
CTGCTGATGG CCGTGGTGCT GCCGCCGTAT CAGGTGTTCA CGGTCAAGCA GAAGGTCGAC 
TCGATGGACA CGATCCAGGG CCTGAAGCTG CGCTCGACCG GCGGCGCTCA GGACCTGACG 
TTGCGCGCGC TCGGCGCCGT GCCGGTGCGC ATGGCGGCGC CCGACGCCTA TGAGTCGCTG 
GCGCGCGGGA CGATGGATGG CGTGCTGTTC CCGGCCGACA GCATCGCGTC CTACGGCCTC 
GATAAACTGG TCAAGCATGC CACCGACGGC GTCAGCTTCG GCTCCTTCAT CGTCGCCTAT 
TCGATCAGCG AGCGGGCGTG GGCCAAGCTG CCGGACGACG TCAAGAAGGC GATGGAAGAA 
GCTTCCGAGG CGATCGAGCC GAAGGTGTGT TCGGACGTCG ACAAGGAGCA GCTGCAGACC 
CGCAAGCAGC TCAACGAAGC GGGCGTGACC TTCGATCCGA TCCCCGACGC CACCAAGGCG 
CAGATGAAGG ACAAGCTCAA AGGCGTCGCC AAGGAATGGG CCGCGGGCGT CGACTCCCGC 
GGCAAGCAAG GCACGCAGGC GCTCGAAGAG TTTCAGAGCC TGCTCGCCGC TGGTGCGAGC 
AAGTAA

Protein sequence

MRTSVAWAVA LSLPVTMALA PAQALELKVA DSFPAGHYLV RLMLKPWMDD VTKRTNGAVT 
FSYYPNQQMG KATDLLRLTQ SGVVDIGYIA PSYASDKMPL SEVAQLPESF TTSCQGTMAY 
WKSARDGVLA RQEYAPNKIK LLMAVVLPPY QVFTVKQKVD SMDTIQGLKL RSTGGAQDLT 
LRALGAVPVR MAAPDAYESL ARGTMDGVLF PADSIASYGL DKLVKHATDG VSFGSFIVAY 
SISERAWAKL PDDVKKAMEE ASEAIEPKVC SDVDKEQLQT RKQLNEAGVT FDPIPDATKA 
QMKDKLKGVA KEWAAGVDSR GKQGTQALEE FQSLLAAGAS K