Gene RPD_1114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1114
Symbol
ID	4021590
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	1267829
End bp	1268749
Gene Length	921 bp
Protein Length	306 aa
Translation table	11
GC content	64%
IMG OID	637961306
Product	WecB/TagA/CpsF family glycosyl transferase
Protein accession	YP_568253
Protein GI	91975594
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1922] Teichoic acid biosynthesis proteins
TIGRFAM ID	[TIGR00696] bacterial polymer biosynthesis proteins, WecB/TagA/CpsF family

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.51541
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCAAAG CGCAAGATGC CAGCCGAAAT CCAGTTTCTG ATCCGCTGAA TGCCGAGCGG 
CGAGCCGAGG AGCGTCGAGT CGCGCCGTTC CACGTTTCGA CCGACAGCTC CGTTTCGTTC 
GAGGAACGGC GGGTGACTGG CGAGCGTCGG CGCGAGCGGT TTCAGCAATG GCAGCGCAAC 
ATGATCGGCG GCCTGCCGAT CGTCGTCGCC GACCGTGCCG AAACCGCAAA GGTGATGGTC 
GACGAGGCGC TGAAGCGCCG CGGCCAGTGG CGCTACCCGG CCTATATGAC GTCGACCAAC 
GGCGAGGTCA CCTATCGCTG CGCAGTCGAT CCGAGCGAAC GTGCGATGTT TCTGGAAGCC 
GATGCGATTC ACGCCGACGG CATGCCGCAC GTGTTCGTGT CACGGTTCAA ATGCCAGACT 
CCGCTGCCGG AGCGCGTCGC GACCACCGAC CTGTTTCACG ATGTCGCGCG CGAAGCCAGT 
GTGCGCGGCG CGACGATGTT CATGCTCGGC GCCGACGAGA CCTCGAACCG TCTCGCGACC 
GAATTGGTGA AGCGACGCTA TCCCAAGCTA AAACTGGTCG GGCGGCGCAA CGGCTTCTTC 
GCCGACGAGG CGGAAGAGAT CGCGGCCTGC CGGCAGATCG CCGAACTGGC TCCCGATATT 
CTCTGGATCT CGATGGGCGT CCCGCGCGAG CAGGTCTTCA TCCGGCGGCA TCGCCATCGG 
CTGACCACCG TCGGAATCAT CAAGACGTCG GGCGGCCTGT TCGATTTCCT GTCGGGCTCC 
AAGGCGCGGG CGCCGCAGTG GATGCAGCGA ATTGGCCTCG AATGGCTATG GCGGATGGCG 
CTCGAGCCGC GACGGCTCGG GATGCGCTAC CTCAAGACCA ACCCTTACGC GATGTATCTG 
CTGCTGACCC GGACGCGCTG A

Protein sequence

MPKAQDASRN PVSDPLNAER RAEERRVAPF HVSTDSSVSF EERRVTGERR RERFQQWQRN 
MIGGLPIVVA DRAETAKVMV DEALKRRGQW RYPAYMTSTN GEVTYRCAVD PSERAMFLEA 
DAIHADGMPH VFVSRFKCQT PLPERVATTD LFHDVAREAS VRGATMFMLG ADETSNRLAT 
ELVKRRYPKL KLVGRRNGFF ADEAEEIAAC RQIAELAPDI LWISMGVPRE QVFIRRHRHR 
LTTVGIIKTS GGLFDFLSGS KARAPQWMQR IGLEWLWRMA LEPRRLGMRY LKTNPYAMYL 
LLTRTR