Gene Rpal_3782 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_3782
Symbol
ID	6411460
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	4065182
End bp	4066390
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	59%
IMG OID	642713663
Product	polysaccharide export protein
Protein accession	YP_001992756
Protein GI	192292151
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1596] Periplasmic protein involved in polysaccharide export
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGTACGCA AGACGTTTCA GGTGCTTGCT GGTCTGCTGT TGCTGATTTC GATGTCAGCG 
TGTTCGGTTC TGCCAGGCAC GGGCCCTTCA AGTGAATCAG TCGAGAATTA TGCGACGGCC 
GGGGTTCGGT CGACGACTGC ATTGCCTTAC GCGCTGGTAG ACGTCTCCGC CGATACCATC 
GGCTTCCTGT CCCAGCCCAA CGTGGTCTCG TTCAAAGGCT CGTTTAAAGA CAGACGGCCG 
AAGCCTCAGC AGGTCATCGG CGTCGGTGAC GTCCTGAACA TCTCGATCTT CGAAGCCGCG 
CCAGGGGGAC TGTTCACCCC TGGTCAATCT GCCGGCGCTC GCCCCGGTAA CTTCGTCGAT 
CTGCCGCCGC AGGCTGTGGA CCAGCGCGGC AATATTTCCG TTCCTTACGC TGGCGAGGTG 
CCCGCGGCTG GGCGAACGGT TCCCGAAGTT CAGCAGGCGG TGGTCGCAAG GCTGCGCAAC 
AGGGCGATCG AGCCCCAGGT TGTCGTGAGC CTCAACCAGC AACATTCGAG CGTCGTAAGT 
GTTCTGGGCG ACGTTAATAC TCCTGGCGTG TTCGCGCTCA ACAGCGTCGG TGAGAAGCTC 
CTCGCGCTGA TCGCGCGCGC GGGTGGACCC AAGTATGAAG CGATCGAAAG CTATGTGACG 
CTTCAGCGCG ATGGCAAGAA GGTGAAGGTC CTCCTGAGCC GGATCGTTCA CGATCCGTCA 
GAGAACATCT TTGTCCGTCC CAACGACGTG ATCTTCCTTA CCCGGGAGGC ACCGACCTTC 
ACGGCTCTTG GTGCTCTCAA TCAGAACGTG TTCGGCTATA ATTCTGAGCT GACCTTCGAC 
GTCGAAACGC TGACGCTCGC CCAGGCAATC GGCAAGGCCG GCGGTCTGAA CGATCAGCAG 
TCGGATCCGG CCGAAGTCTT CGTGTTCCGC TACGAGGATC GACCGCTGCT TGCGAAGCTC 
GGCGTCGACA CCAACCGCTT CGTCTACGAC CGCATTCCGA CGATCTATCA CGTCAACCTG 
CGGGATCCGG CCGGTATGCT TCTGGCCTCT GGCTTCCAGA TCCGAAGCAA GGACGTCATG 
TACGTGGCAA ATGCGCGGGT GGTCGATTAC TACAAGCTCC TGACGCTGAT CAACAACACC 
GCCAACACCA CGTCGAATGT GTCCAACGCG GCAATCAATG TGAACGCAGC GACGAAGACG 
CGTTGGTGA

Protein sequence

MVRKTFQVLA GLLLLISMSA CSVLPGTGPS SESVENYATA GVRSTTALPY ALVDVSADTI 
GFLSQPNVVS FKGSFKDRRP KPQQVIGVGD VLNISIFEAA PGGLFTPGQS AGARPGNFVD 
LPPQAVDQRG NISVPYAGEV PAAGRTVPEV QQAVVARLRN RAIEPQVVVS LNQQHSSVVS 
VLGDVNTPGV FALNSVGEKL LALIARAGGP KYEAIESYVT LQRDGKKVKV LLSRIVHDPS 
ENIFVRPNDV IFLTREAPTF TALGALNQNV FGYNSELTFD VETLTLAQAI GKAGGLNDQQ 
SDPAEVFVFR YEDRPLLAKL GVDTNRFVYD RIPTIYHVNL RDPAGMLLAS GFQIRSKDVM 
YVANARVVDY YKLLTLINNT ANTTSNVSNA AINVNAATKT RW