Gene RPB_4203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4203
Symbol
ID	3912011
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	4774711
End bp	4776087
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	68%
IMG OID	637886106
Product	lytic murein transglycosylase
Protein accession	YP_487805
Protein GI	86751309
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2951] Membrane-bound lytic murein transglycosylase B
TIGRFAM ID	[TIGR02283] lytic murein transglycosylase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.486659
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGTTTG ATGGGGTGGC CATGCGGCGG ATGAACTTGG TGCAACGACT GGCGAGCAAC 
TGGCGCGGCG CCGTGTTGGC AGCACTGGCA ACTGCCCTGT CCGCCTCCCC CGCTCTCGCC 
CAGCGCGGCG CGTCCTGCCA TGGCGGGCAG AGCTTCGATC AGTTTCTCGC CGGGCTGAAA 
CAGCAGGCGG TCGCGGCCGG GGTGTCGCAG CGGGCGATCG CGCAGGCTTC GCCGTATCTC 
GTCTACGACC AGGGCATCGT CAATCGCGAC CGCGGGCAGC GGGTGTTCGG GCAGATCTTC 
ACGGTGTTCG CCGGGCGGAT GGCGTCGGAG GGCCGGCGCG TCAAGGGCCA GCAGATGATC 
AAGCAGCACG CGCAGGCCTT CGCGCGCGCC GAGAAGGAAT ACGGCGTGCC GCCGGCGGTG 
ATCGCCGCAT TCTGGGCGCT GGAGAGCGAT TTCGGCGCGG TCCAGGGCAA CCTCTCGACG 
CTGCGCTCGC TGGTGTCGCT GGCCTATGAT TGCCGCCGCT CCGAAAAGTT TCAGCAGGAG 
ACCATCGCGG CGCTGAAGAT CGTCGACCGC GGCGATCTGG CGCCCGCCGA AATGATCGGC 
TCCTGGGCCG GCGAGCTCGG CCAGACGCAG TTTTTGCCGC GGCACTATTA CGACTACGCA 
GTCGACTATG ACGGCGACGG CCACCGCGAC ATGCTGCGCA GCCCCGCCGA CGTCATCGGC 
TCGACCGCGC ATTACATCGC GGCCGGGCTG AAATGGCGGC GCGGCGAGCC CTGGCTGCAG 
GAAGTGCAGG TGCCGGCCAA CCTTCCCTGG GATCAGGCCG ACCTGCTCAT CAAGCATCCG 
CGCGCGCAAT GGGCGCAATG GGGCGTGACT TTCGCCGACG GACGGCCGCT GCCGGGCGAC 
ACGCTACAGG CGTCGCTACT GCTGCCGATG GGCCGCCACG GCCCGGCGTT TCTGGCCTAC 
GCGAATTTCG CCGCCTATAC CGAATGGAAT AATTCGCTGA TCTATTCGAC CACCGCCGGC 
TATCTGGCCA CACGGATCGC CGGCGCGCCG CCGATGCGCA AGCCGACCGT GCAGATCGCG 
CAATTGTCGT TCAACGAGAT GAAGCAATTG CAACAGTTGC TGACGCGCGC CGGCTTCGAC 
GTCGGCAAGA TCGACGGCAT CCTCGGCCAG CAGAGCCGCA GCGCGGTGAA GGCGATGCAG 
ATCAAATACG GCCTGCCGGC GGATTCCTGG CCGACCGCCG AACTGCTGAC GAAGATGGGC 
GGAACGGTTA CCCCCGCGCC GTCCGCTTCC ACCGAACCGC CGTTCCGGCC GGTCGCGAGA 
CCCGACGCAG CGCCGGCCGA ACGGCGCCCC CGCAATCCAC CGGCGCGGCA GCCGTAG

Protein sequence

MTFDGVAMRR MNLVQRLASN WRGAVLAALA TALSASPALA QRGASCHGGQ SFDQFLAGLK 
QQAVAAGVSQ RAIAQASPYL VYDQGIVNRD RGQRVFGQIF TVFAGRMASE GRRVKGQQMI 
KQHAQAFARA EKEYGVPPAV IAAFWALESD FGAVQGNLST LRSLVSLAYD CRRSEKFQQE 
TIAALKIVDR GDLAPAEMIG SWAGELGQTQ FLPRHYYDYA VDYDGDGHRD MLRSPADVIG 
STAHYIAAGL KWRRGEPWLQ EVQVPANLPW DQADLLIKHP RAQWAQWGVT FADGRPLPGD 
TLQASLLLPM GRHGPAFLAY ANFAAYTEWN NSLIYSTTAG YLATRIAGAP PMRKPTVQIA 
QLSFNEMKQL QQLLTRAGFD VGKIDGILGQ QSRSAVKAMQ IKYGLPADSW PTAELLTKMG 
GTVTPAPSAS TEPPFRPVAR PDAAPAERRP RNPPARQP