Gene RPC_4001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_4001
Symbol
ID	3969347
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	4449338
End bp	4450705
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	67%
IMG OID	637927105
Product	polysaccharide biosynthesis protein
Protein accession	YP_533846
Protein GI	90425476
COG category	[R] General function prediction only
COG ID	[COG2244] Membrane protein involved in the export of O-antigen and teichoic acid
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.443077
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGCTCTCC TGGAAGCTCG TTCAGCCACC CCGCTCGCCG GCCTCAAGGC GCGGTTGCGG 
GCGATGTTCG GCGGCGGCCA CGAGGCCGCG CTGACCAACC GGCTGGCCGG CACCATCTTC 
ATCATCCGCG TGGTCAGCGC CGCCTTGGCG TATCTGTCGC AAGTGCTGCT GGCGCGCTGG 
ATGGGCGGCG CGGATTACGG CACTTACGTC TATGTCTGGA CCTGGGTGCT GCTACTCGGC 
TCGATGCTGG ATTTCGGCAT CGCGATGTCG TGCCAGAAGA TCATTCCGGA ATATCGCGCC 
GCCGGCGCCC ACGCCTTGTT GCGCGGTTTT CTGTCCGGCA GCCGCTGGGC CACGCTGGCG 
GCCTCGAGCG CGGTGGCGCT GGCGCTCGCC GGGCTGGTGC GGCTGCTGTC GCCGTGGATC 
GATCCGCCGG CCGTGGTGCC GCTGTATCTC GGCTGCCTGA CGCTGCCGGC CTTCGTGGTC 
GCCAACACCC AGGACGGCAT CGCCCGCTCG CACGACTGGA TGCGGCTCGG CTTGATGCCG 
CAATTCATCG TCCGGCAATC GCTGATCATC GGCTTCACCG CCGGCGCCGT GGTGCTCGGC 
TTTCAGCTCG GCGCGGTGGC TGCGATGATC GCCAGCTGCG CCGCGGTGTG GATCGCGATG 
CTCGGCCAGC TGCTCGCGCT GAACCGCCGG CTTGAGGGCG TGATCGACCC CGGCCCCAAA 
GCCTATGAAT TCCGCAGCTG GCTGAAAACC TCGCTGCCGA TCATGATGGT CGAGGGCTTC 
TATCTGCTAT TGTCCTATAT CGACGTCCTG GTGCTGCAGC ATTATCGCTC GGCCGAAGAA 
GTCGGGGTGT ATTTCGCGGT GATCAAGACG TTGGCGCTGG TGTCGTTCAT CCACTACGCG 
ATGTCGGCGG TCACCGCGCA TCGCTTCAGC GAGTATCACA CGAGCGGCGA CAAGGCGCGG 
CTCGCCGCCT ATCTCCGCCA CGCCATCACC TGGACGTTCT GGCCGTCGCT GGCCGCCACC 
GTCGTGCTGC TGGCGCTGGG CAAGCCGCTG TTGTGGCTGT TCGGGCCGCA ATTCGTCGCC 
GGCTACGACA TCATGTTCAT CGCCGCGATC GGCCTCGTGG TGCGCGCCGC GATCGGCCCG 
GTGGAACGGC TGCTCAACAT GCTCGGCCAG CAGAACCTCT GCGCGCTGGC CTATGCGCTG 
GCGTTCGCGA TCAACCTCGT GCTGTGCATC GCGCTGGTGC CGCGGTTCGG CGGCCACGGC 
GCCGCCGCCG CCACCTCGCT GGCACTCACT TTCGAAACCG TGCTGCTGTT CTGGATCACC 
CGCCAGCGGC TCGGCCTGCA CGTGCTGGCG TTCGGCAAGC GGGCCTGA

Protein sequence

MALLEARSAT PLAGLKARLR AMFGGGHEAA LTNRLAGTIF IIRVVSAALA YLSQVLLARW 
MGGADYGTYV YVWTWVLLLG SMLDFGIAMS CQKIIPEYRA AGAHALLRGF LSGSRWATLA 
ASSAVALALA GLVRLLSPWI DPPAVVPLYL GCLTLPAFVV ANTQDGIARS HDWMRLGLMP 
QFIVRQSLII GFTAGAVVLG FQLGAVAAMI ASCAAVWIAM LGQLLALNRR LEGVIDPGPK 
AYEFRSWLKT SLPIMMVEGF YLLLSYIDVL VLQHYRSAEE VGVYFAVIKT LALVSFIHYA 
MSAVTAHRFS EYHTSGDKAR LAAYLRHAIT WTFWPSLAAT VVLLALGKPL LWLFGPQFVA 
GYDIMFIAAI GLVVRAAIGP VERLLNMLGQ QNLCALAYAL AFAINLVLCI ALVPRFGGHG 
AAAATSLALT FETVLLFWIT RQRLGLHVLA FGKRA