Gene RPB_3840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3840
Symbol
ID	3911643
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	4386405
End bp	4387448
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	71%
IMG OID	637885740
Product	glycosyl transferase family protein
Protein accession	YP_487444
Protein GI	86750948
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCGCCGC ATCGGCCGCC ACAAGTCTCG GTGATCCTGC CGGTTCGCGA CGGCCAGCGC 
TGGCTGCGCG AGGCGGTCGA CAGCGTGCTG GCGCAGACCT TGTCCGATCT CGAACTCCTG 
GTGATCGACG ACGGCTCGAC CGACGCGACG CCGGCGATCC TCGATGAAGC GCGCGCCCGC 
GATCCGCGTG TCGTCGTGCT GCGGCAGAGC CGCGAGGGGC TGGTCGCGGC GCTCAATCTG 
GGCCTGGCGC GGGCCCGCGC GCCGCTGATC GCGCGACTCG ACGCCGACGA CATCGCGCTG 
CCGGAGCGGC TCGCGCGGCA GCGCGACTAT CTGCAGGCGC ACCCGGACGT CGTGCTGCTC 
GGCGGCTGGG CCGAGATCAT CGACGCCCAG GGCGCATCGT CCGGCCGCCA GATGCGGCCG 
AGCCCGGACG GCCTGCGCGA GACGCTGACC AAGAAGAGCC CGTTCATCCA TCCGACGGTG 
ATGTTCCGCA CAGACGCCGC GCGGCGCATC GGCGGCTATC GCGCCGCCTT CGAGGCCGGC 
GAGGATTATG ATTTCTGGCT GCGCCTCGCC GATATCGGCG CCATCGCCAT CCTGCCCGAG 
GTGCTGATCC GCTATCGCGA GCACGGCGGC AGCGTTACAC GCACCCGCGA GTTGCGGCAG 
ATCTATTCCG CCCGCCTCGC CAAGCTCGCC AGCGCCGCCC GCAGCCACGG CGGCCCCGAT 
CCCTCGGCGA TCTTGACCGC GCCGCCCGAC TGGCACGATG ACGATCCCGG CAATTTCGAG 
CGCGACAGCT CGCGGCTGTT CCGGATGCTA GAACTCGCCG ACCCCTCGCT GGCGCGCACG 
GCGCCAGCGT CCGCGATCGA CCTCGCTGCG ATCACCTCGC AGCGATCCAC GCTGACCGCC 
GGCGAACGGA AGTTCGCGCA AGCCGCATTG CTGAACCTGC TGCGCGAGCG CCGCGACCTC 
CCGGTCTCCC GCGCCAGGCT GATCGCCCTG CTGCTATGGC TGGGACCGGC GAAGGCGATG 
AAGAAGCTGA TACGGACGAA GTAA

Protein sequence

MSPHRPPQVS VILPVRDGQR WLREAVDSVL AQTLSDLELL VIDDGSTDAT PAILDEARAR 
DPRVVVLRQS REGLVAALNL GLARARAPLI ARLDADDIAL PERLARQRDY LQAHPDVVLL 
GGWAEIIDAQ GASSGRQMRP SPDGLRETLT KKSPFIHPTV MFRTDAARRI GGYRAAFEAG 
EDYDFWLRLA DIGAIAILPE VLIRYREHGG SVTRTRELRQ IYSARLAKLA SAARSHGGPD 
PSAILTAPPD WHDDDPGNFE RDSSRLFRML ELADPSLART APASAIDLAA ITSQRSTLTA 
GERKFAQAAL LNLLRERRDL PVSRARLIAL LLWLGPAKAM KKLIRTK