Gene RPD_2447 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2447
Symbol
ID	4022938
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	2730459
End bp	2731838
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	69%
IMG OID	637962640
Product	peptidase M23B
Protein accession	YP_569578
Protein GI	91976919
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0739] Membrane proteins related to metalloendopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCTACC GTTCCGGTCA CCCTTCCGAA CACCATCCCA ACCACGCCCC GAACTACGGC 
CGGCCGCAGC CGCACCGGGC GCAGCGCCCG CATCCGGGGC AAAGGCCTTC TCCTGAAGTC 
CCCGCCGAGG CCTCCAGCTA CACCATCGCC CATGCCGGCA AGCAGGTCCG GATCGGGCCG 
GTGGTGTTCT GGATCGTGGT CGGCACCATC GTTGCGCTGG GCTGCTGGTC GGCGGCCACC 
GCCACTTACT TCGCATTCCG CGACGATGTG CTGACGAGGC TGATCGCCCG CCAGGCGGAG 
ATGCAATACG CCTATGAGGA TCGCATCGCC GAGCTGCGCG CCAAGGTCGA TCGCACTACC 
AGCCGGCAGT TGCTCGATCA GGAGCAATTC GACCAGAAGC TCGATCAGGT GATGCGCCGC 
CAGACCATGC TGGAGTCGCG CGCCAGTGCG CTGAACACCC TGCCCGACGT CGTGGTCACC 
GGCAGCATCA AGAGCTCGCG GACGCCGTCG ACCGACACTG CGCCGGCCGG GCCGCTGAAG 
CCTTCGCCGA TCAACGACAC CGTGATCTTC GTCGCGCCGC CGGACCGCGA GGCGCGGCTG 
GAGTCGCGTT CTCCCGCAGC CGCGCCGGCG CTGCCGACCA CGCAATACGC CAAGGCGCAG 
GGCCTCGACA CCGCGCTCTC CAAGCTCGAG CAGTCGCTCG ATCAGGTCGA GAAGCGGCAG 
ATCGCGGCGC TCGGCTCCGT CGAGGAATCC TACGAAACCC GCGCCCGCCG GATGCGCGGC 
GTCTTCACCG ATCTCGGCCT CGACACCCGC GGGCTGGAAG CCGCCGCACC GCGCGCCGGC 
ATCGGCGGTC CGTTCGTGCC GTTGAAGGCG CCGTCGACCA ATGCCAGCTC GTTCGACCGC 
CAGCTCTATC GGATCAACCT CGGCCGCGCC CAGCTCGACC GCCTCAACCG GGCCCTGTCG 
CTGGTGCCGT ATCGCAAGCC GGTGATCGGC AACGTCGAAT TCTCGTCCGG CTTCGGCGTC 
CGCAGCGATC CGTTTCTCGG CCGCCCGGCG ATGCACACCG GCCTCGATTT CCGCGCCTCA 
TCCGGCGACC CGGTCCGCGC CACCGCGATC GGCAAGGTAG TGAATGCCGG CTGGCAGGGC 
GGCTACGGCC AGATGGTCGA GATCGACCAC GGCAACGGCC TGTCGACCCG CTACGGCCAC 
CTGTCGAAGA TCATCGCCAA GGTCGGCCAG AGCATCCAGA TCGGCCAGGT GATCGGCGAA 
GTCGGCTCGA CCGGCCGCTC CACCGGCCCG CATCTACACT ACGAAACCCG CATCGAAGGC 
GAAGCCGTCG ACCCGCAGAA GTTTTTGCGT GCGGGGGTGC GGCTGGCGGG GGCGGGTTAG

Protein sequence

MSYRSGHPSE HHPNHAPNYG RPQPHRAQRP HPGQRPSPEV PAEASSYTIA HAGKQVRIGP 
VVFWIVVGTI VALGCWSAAT ATYFAFRDDV LTRLIARQAE MQYAYEDRIA ELRAKVDRTT 
SRQLLDQEQF DQKLDQVMRR QTMLESRASA LNTLPDVVVT GSIKSSRTPS TDTAPAGPLK 
PSPINDTVIF VAPPDREARL ESRSPAAAPA LPTTQYAKAQ GLDTALSKLE QSLDQVEKRQ 
IAALGSVEES YETRARRMRG VFTDLGLDTR GLEAAAPRAG IGGPFVPLKA PSTNASSFDR 
QLYRINLGRA QLDRLNRALS LVPYRKPVIG NVEFSSGFGV RSDPFLGRPA MHTGLDFRAS 
SGDPVRATAI GKVVNAGWQG GYGQMVEIDH GNGLSTRYGH LSKIIAKVGQ SIQIGQVIGE 
VGSTGRSTGP HLHYETRIEG EAVDPQKFLR AGVRLAGAG