Gene RPB_1539 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1539
Symbol
ID	3908453
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	1733326
End bp	1734621
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	68%
IMG OID	637883435
Product	glycosyl transferase, group 1
Protein accession	YP_485160
Protein GI	86748664
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCCGC TCTCGGTGGT GCATCTGGCC CAGTCCGACA GCGAGGGCGG AGCGAACAAG 
GCGGCCTATC GCATCCACAA GAATTTGCAG ACGCTCGGGC TTCGCTCGAC GTTCCATGTC 
GGTCGCAAGC TTCGCGATGA TCCGTCGGTC GTGCCGGCGC ATTGGCCCGG TGTCGGCAGG 
CTTGGCAGCG ACGTGGTCGC CTATCTCAAT GCGCGGACGC TGAGGAGCTA TCCGCACCGG 
CTCGGAACGC CGTTTTCGCC GTCGTGCCTG CGCTATGGGC ACCTGGACCG TGGGCTGATC 
GCCGGCGCCG ACGTCGTCTG CGCGCACTGG ATCGCCGGCG CCTTTCTGAA TTTCGGGCAG 
TTGAAGGGCA TAGCAGCACC TTTGGTCTGG AGGCTTTCGG ACATCTGGCC GTTCAGCGGC 
GGGTGCCATT ATCCCGGGGG CTGCTCCGGC TTCGAGCGGG CCTGTGGGGG CTGTCCGCAG 
CTCGGCAGCA CCGAGGAGCA CGATCTGTCG CGGAGGGGCC TGCGGGCGCG GGAAGCCGCC 
TATGGCGACC TCGATCTGAC CATCGTCGCC CCGAGCCGCT GGATCGCCGG TCTGGCGGGC 
CGTTCCAGCC TGTTTGGCGG CCGGCGGATC GAACATATTC CGACCGGTGT CGATCTGCAG 
GTGTTTCGGC CGCGCGACCG GCTGGCGGCG CGCCACACGA TCGGACTGCC GGAGAGCGGT 
ACGATCGTCC TGTTCGGCGC TCTGAGCGCG ACGGACGATC CGCGCAAGGG CTATGCGCAT 
CTGCTGCGGA CGATCGAGAA CCTCGCGGCT GCCGGCCGCA GGGATCTCTC GCTGGTCGTT 
TTCGGCGGCG CCACCCAGGG GGCCGCCACC TCGATCGCCG GTTACCCCGT CCATCACCTC 
GGCAGCATCG GCAGCGAGGA ACGGCTGGCG GAGATCTATT CCGCCGCGGA CGTGCTGATC 
GCGCCGTTTC TGGAAGACAA CCTGCCGAAC GTGGTGCTGG AGGCGGTCGC CTGCGGGACG 
CCGGTCGCCG CATTTGCCGC GGGCGGTATC CCGGATGCGA TCGACCATCA GGTGAACGGC 
TATCTGGCAT CGACGGGCGA CGATGCGGAG CTCGCGCGGG GGGTGGCCAG CCTTCTCGAT 
CGCCCCGATG CTGCACACGT GCGGAGCGCC GCACGCCGGC TTGCGGAGAC CCGATTCGAC 
CTGCTGGACT GTGCGCGACG CTACATCGCC CTGTTCGAGG AACTCGCCGA GGCGTCTCGT 
TCGCAAATTG ACAAGACCGC CGGGCGACGA CATTGA

Protein sequence

MKPLSVVHLA QSDSEGGANK AAYRIHKNLQ TLGLRSTFHV GRKLRDDPSV VPAHWPGVGR 
LGSDVVAYLN ARTLRSYPHR LGTPFSPSCL RYGHLDRGLI AGADVVCAHW IAGAFLNFGQ 
LKGIAAPLVW RLSDIWPFSG GCHYPGGCSG FERACGGCPQ LGSTEEHDLS RRGLRAREAA 
YGDLDLTIVA PSRWIAGLAG RSSLFGGRRI EHIPTGVDLQ VFRPRDRLAA RHTIGLPESG 
TIVLFGALSA TDDPRKGYAH LLRTIENLAA AGRRDLSLVV FGGATQGAAT SIAGYPVHHL 
GSIGSEERLA EIYSAADVLI APFLEDNLPN VVLEAVACGT PVAAFAAGGI PDAIDHQVNG 
YLASTGDDAE LARGVASLLD RPDAAHVRSA ARRLAETRFD LLDCARRYIA LFEELAEASR 
SQIDKTAGRR H