Gene Rpal_3089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_3089
Symbol
ID	6410760
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	3331756
End bp	3333312
Gene Length	1557 bp
Protein Length	518 aa
Translation table	11
GC content	65%
IMG OID	642712969
Product	Undecaprenyl-phosphate glucose phosphotransferase
Protein accession	YP_001992070
Protein GI	192291465
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2148] Sugar transferases involved in lipopolysaccharide synthesis
TIGRFAM ID	[TIGR03023] Undecaprenyl-phosphate glucose phosphotransferase [TIGR03025] exopolysaccharide biosynthesis polyprenyl glycosylphosphotransferase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.411544
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGCCGA TCAGCGCACG TTCGATGATC AGTGCTGCTG CGACGGAAGC CGTGGTCGCC 
AGCGGCGACG GCGCGCCGCG GGTGGAACGC CGCAAGCGGT TGTCGCCGGC CGCCCTCGCC 
GTCGCCAATC AGAAGGTGCC GCCGGCGTTT TCGCCGATCG TGATCGCCGG CTCCGTCCGC 
CTCGCCGATT TTCTCGTGAT CGCCGCCGTC GGCATCGCGC TGTACTTCGC GCTCGTGGTC 
CGCCGCGACG GCTTTGCCTG GGAGTACATC GCGGCGATCA TCGGCACCAC GGCGACTGCG 
GTCGTCGCGT TCCAGGCTGC CGATCTTTAC AAGGTGCAAC TGTTCCGCGG CACCTTGAAA 
CAGATGACCC GGATCATATC GACGTGGTCG ATCGTGTTCC TGCTGTTCAT CGGCGCATCG 
TTCTTCGCCA AGCTCGGCGG CGAGGTGTCG CGGCTGTGGC TGGGTTCGTT CTTTTTCGCC 
GGCCTCGCCT TGCTGATCAT CGAGCGATTG TCGGTGCGCG CGCTGGTGCG GCGCTGGGCG 
TCGCAAGGCC GGCTCGACCG CCGCACCGTG ATCGTCGGTG CCGACGCTAA TGGCGCCAAG 
CTGATCGAAG CGCTGAAGGC CGAGCACGCC GACGCCTCCG ACATCCGTAT CCTCGGCGTG 
TTCGACGACC GCAACGACGC CCGCTCGCAG TCCACTTGCG CGGGCGTTCC GAAGCTCGGC 
AAGGTCGATG ACATTCCCGA ATTCGCCCGC CGCACCCGTG TCGATCTCGT GCTGTTCGCG 
CTGCCGATCT CGGCCGAGAC CCGCATCCTC GACATGCTGA AGAAGCTGTG GGTGCTGCCG 
GTTGACATCC GGCTGTCGGC GCACACCAAC AAGCTGCGGT TCCGGCCGCG CGCCTATTCC 
TATGTCGGCA AGGTGCCGAC GCTCGACGTG TTCGAAGCGC CGATCACCGA TTGGGATCAG 
GTGATCAAGC AGGTATTCGA CCGCGTCGTC GGCGGTTTCA TCCTGCTGCT CGCCGCCCCG 
GTAATGGCTT TGGTAGCGCT GGCGATCAAG CTCGACAGCC CGGGTCCTGT GCTGTTCCGG 
CAGAAGCGGT TCGGCTTCAA CAACGAGCGC ATCGACGTGC TCAAGTTTCG GTCGATGTAT 
CACGACCAGG CCGATCCCAC TGCGTCAAAG GTCGTCACCC GCAACGACCC GCGCGTCACC 
CGGGTCGGCC GCTTCATCCG CCGCACCAGC CTCGACGAGC TGCCGCAACT GTTCAACGTG 
GTGTTCAAGG GCAATCTGTC GCTGGTCGGC CCGCGCCCGC ATGCGGTGCA GGGCAAGCTG 
CAGAGCCAGC TGTTCGACGA AGCCGTCGAC GGCTACTTCG CCCGCCACCG CGTCAAGCCG 
GGTATCACCG GCTGGGCCCA GATCAACGGC TGGCGCGGCG AGATCGACAA CGAAGAGAAG 
ATCCAGAAGC GCGTCGAGTT CGACCTGTAC TACATCGAGA ACTGGTCGGT CCTGTTTGAC 
CTCTACATTC TGCTGAGAAC TCCGTGGGCG CTGCTCAAGG GCGAGAACGC GTACTGA

Protein sequence

MEPISARSMI SAAATEAVVA SGDGAPRVER RKRLSPAALA VANQKVPPAF SPIVIAGSVR 
LADFLVIAAV GIALYFALVV RRDGFAWEYI AAIIGTTATA VVAFQAADLY KVQLFRGTLK 
QMTRIISTWS IVFLLFIGAS FFAKLGGEVS RLWLGSFFFA GLALLIIERL SVRALVRRWA 
SQGRLDRRTV IVGADANGAK LIEALKAEHA DASDIRILGV FDDRNDARSQ STCAGVPKLG 
KVDDIPEFAR RTRVDLVLFA LPISAETRIL DMLKKLWVLP VDIRLSAHTN KLRFRPRAYS 
YVGKVPTLDV FEAPITDWDQ VIKQVFDRVV GGFILLLAAP VMALVALAIK LDSPGPVLFR 
QKRFGFNNER IDVLKFRSMY HDQADPTASK VVTRNDPRVT RVGRFIRRTS LDELPQLFNV 
VFKGNLSLVG PRPHAVQGKL QSQLFDEAVD GYFARHRVKP GITGWAQING WRGEIDNEEK 
IQKRVEFDLY YIENWSVLFD LYILLRTPWA LLKGENAY