Gene Rpal_4685 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4685
Symbol
ID	6412371
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	5044067
End bp	5045428
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	66%
IMG OID	642714564
Product	polysaccharide biosynthesis protein
Protein accession	YP_001993651
Protein GI	192293046
COG category	[R] General function prediction only
COG ID	[COG2244] Membrane protein involved in the export of O-antigen and teichoic acid
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTCTC CACCCGCGGC AACGTCCCTC GCGGCGCTGA GGGCGCGCCT GACGTCGCTG 
TTCGGCGGTT CCAACGAAGC CTCGCTCACC AACCGGCTCG CCGGCACCAT TTTCCTGATC 
CGTGTCGTCA GCGCAGGTCT CGCCTATGGG GCGCAGATCC TGCTGGCGCG CTGGATGGGT 
GGCTCTGACT ACGGCATCTA CGTCTATGTC TGGACCTGGG TGCTGCTGCT CGGCTCCATG 
CTGGATTTCG GCATCTCCGC CTCAGCCCAG AAGATCATTC CGGAATATCG CGCGCGCGGC 
GAACTCGACA GGCTGCGCGG TTTTCTGTCC GGCAGCCGTT GGGGCACGCT GGCGGCCTCG 
AGCGTGGTAT CGCTGCTGCT CGCCGCACTG GTCTGGGCAC TGTCGCCGCT GATCGGCGAC 
GCCACAGTCA TATCGCTGTA CCTCGGCTGC CTGACGCTCC CGGCATTCGT GGTCGCCAAC 
ACCCAGGACG GCATTGCCCG CTCGCACGAC TGGATGCGGC TCGGGCTGAT GCCGCAATTC 
ATCATCCGGC AGGCGCTGAT CATCGGCTTC ACCGCCGGGC TGTTCGTGCT CGGCTTCGAG 
CTCGGTGCGA TCGCCGCGAT GGCGGCGAGC TGTGCGGCGG TGTGGATCGC GATGCTCGGA 
CAGATGATAG CGCTCAACCG CAGGCTTGCC GGCCACGTCC CGCCCGGCCC GCGCGCCTAT 
GACGTCCGCG GCTGGCTTGC GACCTCGCTG CCGATCCTCC TGGTCGAGAG CTTCTACCTG 
TTGCTGTCCT ACACTGACGT CCTGGTGCTG CAGCAATTCA GCACGCCCGA GGAAGTCGGC 
ATCTACTATG CGGTGGTGAA GACGCTGGCG CTGGTGTCGT TCATTCACTA CGCGATGTCG 
GCCACCACTG CGCATCGCTT CACCGAATAC AACGCGGCCG GCGACAAGGT CCGGCTGGCG 
GCGTATGTGC GCCACGCGAT CGTGTGGACG TTCTGGCCGT CGCTGGTGGC GACGCTGGCG 
CTGCTGGCAC TCGGCGAGCC GCTGCTGTGG CTGTTCGGGC CGCAATTCAC GTCCGGCTAC 
GGCATCATGT TCGTCGCCGC GATCGGCCTG ATGGTCCGTG CCGCGATCGG TCCGGTCGAG 
CGCCTGCTCA ACATGCTCGG CCACCAGCAT GTCTGCGCCC TCGCCTATGC GCTGGCGTTC 
GCGGTCAATC TGGCGCTGTG CCTGATCCTA GTGCCCCGCT TCGGCGGCTA CGGCGCCGCT 
GCCGCCACCT CCGCAGCCCT CACCTTCGAA ACCGTGATGC TGTTCTGGAT CGTCCGCAAA 
CGCCTCGGCC TGCACGTGCT GGCGTTCGGC AGCAAAGGCT AG

Protein sequence

MDSPPAATSL AALRARLTSL FGGSNEASLT NRLAGTIFLI RVVSAGLAYG AQILLARWMG 
GSDYGIYVYV WTWVLLLGSM LDFGISASAQ KIIPEYRARG ELDRLRGFLS GSRWGTLAAS 
SVVSLLLAAL VWALSPLIGD ATVISLYLGC LTLPAFVVAN TQDGIARSHD WMRLGLMPQF 
IIRQALIIGF TAGLFVLGFE LGAIAAMAAS CAAVWIAMLG QMIALNRRLA GHVPPGPRAY 
DVRGWLATSL PILLVESFYL LLSYTDVLVL QQFSTPEEVG IYYAVVKTLA LVSFIHYAMS 
ATTAHRFTEY NAAGDKVRLA AYVRHAIVWT FWPSLVATLA LLALGEPLLW LFGPQFTSGY 
GIMFVAAIGL MVRAAIGPVE RLLNMLGHQH VCALAYALAF AVNLALCLIL VPRFGGYGAA 
AATSAALTFE TVMLFWIVRK RLGLHVLAFG SKG