Gene RPB_1008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1008
Symbol
ID	3909132
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	1154444
End bp	1156507
Gene Length	2064 bp
Protein Length	687 aa
Translation table	11
GC content	69%
IMG OID	637882901
Product	lipopolysaccharide biosynthesis
Protein accession	YP_484629
Protein GI	86748133
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3206] Uncharacterized protein involved in exopolysaccharide biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.597439
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCCCA GGCCGTCTTC CCAAACGATC TCCGACGACC GCAATCCCGA CGGGATCGAT 
TTCAGGAACG TCGCCGGCAT TCTGGCGCGG CGCAAGACCT GGGTGTTCGG CGTTCCGCTG 
GCGCTGTGCG CGGTGGTCCT GGCCTATCTC CTGGTCGCGC AGCCGTCCTA CACCGGATGG 
GCGCAGGTGT TCGTCGATCC GCGCGATCAG TACACGCCGA AGGACGACCC GCTGCAGAAT 
TCGGTGCCGG GCGACGGCCT GCTGCTGGTC GAGAGCCAGC TCAAGATCAT CACCTCGAAC 
GAGGTGCTGA ACCGCGTCAT CGAGCAGATG AATCTGCAGA ACGATCCGGA GTTCAACGGC 
GAGCGGATGG GGCTCGGCCG GCTGGTGAAG GCGCTGATCG GGCTCGGCAA GACCGAGGAC 
CGCGCCCTCG TCACGCTGCG CAATCTGCGC AAGAAGGTCG CCACCAAGCG GGTCGACCGC 
TCCTTCGTGA TCGACATCAT GGCCTCGGCC GACACCGCGC CGCGCGCGGC CGCGCTCGCC 
AATGCGGTGG CGACCGCCTA TCTCGACGAG CAGGCCGGCG CCAACGCCGC GTTTCAGCGC 
CGAACCTCGG AAGCGATCTC GGCGCAGCTC GGCAAGCTGC GGCAGGAGGT CAAGCGCGGC 
GAGGAAGCCG TCGCCGCCTA CAAGGCGGCC AACAATCTGG TCGGCGCGCG CAGCCGGATG 
GTGAGCGAGC AGCAGCTCGA CGAAGCCAAC ACCCAGCTCA CCAACGCCAA GACCCGGCTG 
GCCGATGCGC AGGCGCGGGT CCGGCTGATC GAAACCATCG AGCACGGCGA CGCCGGCCTC 
GAGGCGGTGC CCGAGGCGAT GCAGTCGGCC GCGATCGTGC AGTTGCGCGG GCGGCTGGCC 
GACGCGTCGC GCGAGGAGGC GCAACTCGCG CAGATCGACG GCCCCAATCA TCCGGCGCTG 
CAGGGCGCGC GGGCGCAGGT GCGTGACGTT CAGGCCGCGA TCCAGCGCGA GCTGAAGACG 
ATCGCGCGCT CGGTGCGCAA CACCTACGCC AGCGAACGCA CCAATGTGCA GACCCTGCAG 
GCCAATTTCG ACGCTCTGAA GACGCAGTCG CAGGCCAACG AGAAACTGCT GGTGCCGCTG 
CGCGAGCTGG AGCGCAAGGC GGAATCCAGC CGCATCGTCT ACGAGAACTT CCTCGCCAAG 
GCGAAGACCG CCGAGGAGCG GCAGGGCATC GACACCACCA ACATCCGGCT GATCTCGCGC 
GCCACCACGC CGGAAAACAA GAGCTGGCCG CCGACGCTGA TCATGCTGGC CGCCGCGATC 
TTCGCCGGGC TGACCATCGG CATCGCGCTG GCGCTGGCGC GCGATCACTT CGAGCGCCCG 
GACCGTGGAC CCGAGCCGGA GGCCGTCGAC GAAGTCGATC CTCCCGTCGC GGTCGCGGTC 
GCGCCCGTCC CGGCGCCGCG GCCGGTGATG GCGCAGCCCC GCACCGGCCG GCTGAAGGCG 
CTGAGCGCGG ACCTGCTCGC GGCGCCGAAG GGCCACACCA TCGTGCTGGT CCAGGTGCAA 
CGCGCCGCGT GGCTCGACGA CGTCGCGCTG CAACTCGCGC GGACCGTGAT CGCCGCCGAG 
ATGGACGTGA TGCTGGTCGA CGCCGATCTG GCGCGGCATC ACACCACGTC GCGGCTCGGC 
TTCGACGGTG CGCCCGGCCT GCGTGACGTG ATGGCCGGAA CCGCCGCGAT CAACGAGGTC 
GTGAAGTTGC ACCAGCCGAC CGCGATGCGG ATCGTGCCGG TCGGGCTGTC GGCCGTCGGC 
AATCGCGATC CGCGCGCCCG GCAGGCGCTG CAGTCGGCGG TGCAGCAGCT GCGCGCGTTC 
GACCGCGTCA TCGTCGACGG CGGCGAGATC GGATCGACCG CGTCCGAATT CGGGCTGTAC 
TACATGGCCG ACGAAGTCGT GTTCCTGGCG CAGGGCCCCG GCGGCAAGAG CGAGGACGCC 
GCCATCCTGG TCGATCTGCT GCAATTGCGT CAGGTCAAGG CGCGGATCGT GTTCGTCGAG 
CCGGACGTCG CGGTGGCGGC ATGA

Protein sequence

MSPRPSSQTI SDDRNPDGID FRNVAGILAR RKTWVFGVPL ALCAVVLAYL LVAQPSYTGW 
AQVFVDPRDQ YTPKDDPLQN SVPGDGLLLV ESQLKIITSN EVLNRVIEQM NLQNDPEFNG 
ERMGLGRLVK ALIGLGKTED RALVTLRNLR KKVATKRVDR SFVIDIMASA DTAPRAAALA 
NAVATAYLDE QAGANAAFQR RTSEAISAQL GKLRQEVKRG EEAVAAYKAA NNLVGARSRM 
VSEQQLDEAN TQLTNAKTRL ADAQARVRLI ETIEHGDAGL EAVPEAMQSA AIVQLRGRLA 
DASREEAQLA QIDGPNHPAL QGARAQVRDV QAAIQRELKT IARSVRNTYA SERTNVQTLQ 
ANFDALKTQS QANEKLLVPL RELERKAESS RIVYENFLAK AKTAEERQGI DTTNIRLISR 
ATTPENKSWP PTLIMLAAAI FAGLTIGIAL ALARDHFERP DRGPEPEAVD EVDPPVAVAV 
APVPAPRPVM AQPRTGRLKA LSADLLAAPK GHTIVLVQVQ RAAWLDDVAL QLARTVIAAE 
MDVMLVDADL ARHHTTSRLG FDGAPGLRDV MAGTAAINEV VKLHQPTAMR IVPVGLSAVG 
NRDPRARQAL QSAVQQLRAF DRVIVDGGEI GSTASEFGLY YMADEVVFLA QGPGGKSEDA 
AILVDLLQLR QVKARIVFVE PDVAVAA