Gene RPB_1540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1540
Symbol
ID	3908739
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	1734621
End bp	1735865
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	64%
IMG OID	637883436
Product	glycosyl transferase, group 1
Protein accession	YP_485161
Protein GI	86748665
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGCAA ATCGGCCGGG CCACCGATCC GGCGACGGAA TTGATCCGAA GCCGTCCGTG 
ACGGACGACG CTCCAACCAC TCGACCGGCC AGAAATTCCG CGCAGCCCCC CATGCCAGTT 
TCAGTCGCGC ACGTCCTGCG AACCTATGGC GTCCATGGCG GCGAGCGTCA GCTGGCGCGG 
CTGTTCGCGG CCGAGGATCC CGCCCGCTAT AAGATCACCT TCCTCTCCAT CTACAACAAC 
CCCGAATGCG AGGACTACTT CGCGCGAATT CCGGGATTGC GGCAGAAGAT CGTGCTCGGA 
TTGAAGGCGC CGGTGTTTCC TGCGCTGCGC AGCGAGATGC TGCTGCTGCT GTTGGTGCTT 
CCGGTGCTTC AGGTGCGAAT GCTGTATCTG CTGGCCGCGG GTCGGCATCG AATCTGCGTG 
GCGCACGGCA TTCAGGCCGC CGCCGCGTGC TGGCTCGCGG CATGGTTCAT GCCGCGCATT 
CGCTTTGTCT ATGTCCACCG CGGCACCAAG TCGGAAGCCG GATCCCATCC GATCTTCAAG 
CTGCTCTACA GGCCGTTCGA CGTCGTCGCC GGCGTATCCG TGGCGACCGC CGCGTCGCTG 
ACGTCGCTGG TTCGCGGCGG GAGGGTGCTG ACCCTCGAGA ACGGCATCGA TTGGCAGGCC 
TTTGTCAGCG CCGCGGCCGA TTGCGAAAGG CATCATCCGC CCGGGATCGT GACCCTGATT 
TCGTCGGCAC GGCTGCTTCC ACACAAGGCC CAAGCGTTTC TGTTGCAGGC GTTCGCCGTG 
CTGGTGCGCG AACGGCCGAA TGTCGAACTG ATCGTCGCCG GCGACGGACC GGAGCGGGAC 
AATCTGATCG CCCTGGCGGG GCGGCTGGGC ATCGCCGACA AGGTCCGGTT CCCCGGCCAC 
GTCACCGACA TCAATTGCCG TATCGTCAAC AGCGATATCT TCGTTCATGC CTCCGAGGTG 
GAGGGGATGA GCAACGCCGT CCTCGAAGCC ATGACGCTGG GGCTGCCGAG CGTCGTGGTC 
GATGCGCCCG GCGTCTCCGA ATGTCACATC GAGGGCGACA CCGGATTCAT TGTCGAGCGG 
AATCCGAATG CGATGGCCGC CAGGCTGATC GCGCTGATCG ACGATGCCGA ATTGAGGGCC 
AGAATGGGTC GCCGGGCGCG GCAGCGCGTT GAGGAGCAGT ATTCGATCGC GGCGAATGTC 
GAGCGATATC ACGCGATGTA TGCGGAACTG TTGGCGGGCG CCTGA

Protein sequence

MDANRPGHRS GDGIDPKPSV TDDAPTTRPA RNSAQPPMPV SVAHVLRTYG VHGGERQLAR 
LFAAEDPARY KITFLSIYNN PECEDYFARI PGLRQKIVLG LKAPVFPALR SEMLLLLLVL 
PVLQVRMLYL LAAGRHRICV AHGIQAAAAC WLAAWFMPRI RFVYVHRGTK SEAGSHPIFK 
LLYRPFDVVA GVSVATAASL TSLVRGGRVL TLENGIDWQA FVSAAADCER HHPPGIVTLI 
SSARLLPHKA QAFLLQAFAV LVRERPNVEL IVAGDGPERD NLIALAGRLG IADKVRFPGH 
VTDINCRIVN SDIFVHASEV EGMSNAVLEA MTLGLPSVVV DAPGVSECHI EGDTGFIVER 
NPNAMAARLI ALIDDAELRA RMGRRARQRV EEQYSIAANV ERYHAMYAEL LAGA