Gene Rsph17029_1203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1203
Symbol
ID	4895884
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	1249198
End bp	1250397
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	73%
IMG OID	640111789
Product	peptidase M23B
Protein accession	YP_001043085
Protein GI	126461971
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0739] Membrane proteins related to metalloendopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.104562
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCCACC GTCCCACGCG CGCAGGCGCC CTTTGCATGA CGGCGACGCT GACGATCCTC 
GCCGCCTGCA GCACTTCGGA CCTAGACTGG GACCTGCGCG GTCGCCCCGG CGGGCTCAGC 
ACGGCCGAGG CCGCGCGGGC GGTCAGCGCC CCCCGCCCCC GCGCCGACGA CCGCGGGATC 
ATCTCCTATC CGACCTATCA GGTGGCCGTT GCCCGTCAGG GCGAGACGGT CGCCTCGCTC 
TCGAGCCGCC TCGGGCTCGA TGCCACGCAG GTCGCGAGCT ACAACGCCCT CTCGCCGCAG 
AACCCTCTGC GCGCCGGAGA AGTGGTCGTG CTGCCGCAGC GCGTGGCGGC GGCTCCCGCC 
ATGACCCCGG CGCCCGTCAT GACGGCGCCC GGCGCGGCGA GCCCCGGCGG CATCGACGTG 
ACCGCCATCG CCACGAGCGC CCTCGACCGG GCAGGCCCTG CCCCGGCGCC GGTGGCCGCC 
GCTCCCGCTG CGGCCCCCGC GCAGTCTGCC GCGACCGAGC CGGCCCGCCA CCGCGTGTCG 
CGGGGAGAGA CCGCCTATTC GATCGCGCGC AGCTACAATG TCTCGCCCAA GGCGCTGGCG 
GACTGGAACG GGCTCGGGCC GGATCTTGCG ATCCGCGAGG GCCAGTATCT GATGATCCCG 
ACCGCCTCTG CGCCCCCGCC CACGGTGCCC GCCAACGTGA CCGCGGTCAC GGTGCCCGGG 
GCAGGCTCGC CGACGCCCAC CCCGCCCTCG GCGGCCAAGC CGCTGCCCGC CGAGTCGACC 
ACGCCCGCCT CGAAACCCTC AGGCCAGCCC GCCTCACCCG ACATGGGCGC ACAGCGCACG 
CAGGCCTCGG CCTCGCGGCT GGGATTCCCG GTGCAGGGCA AGATCATCCG CGGCTATGTG 
AAGAAGAAGA ACGACGGCAT CGACATCTCG GCGGCCGTGG GCACGCCGGT GGCGGCGGCC 
GCGGACGGGA CGGTGGCGGC CATCACGCAG GACACCGATC AGGTGCCGAT CCTCGTGATC 
CGGCACCCCG ACAACCTGCT GACGGTCTAT GCCAATATCG ACGGCATCAA GGTCACCAAG 
GGTGCCAGCG TGAAGCGCGG ACAGCCCATC GCCGTGGTGC GCGCGGCCGA CCCGCCCTTC 
GTCCATTTCG AGGTCCGCAA GGGGTTCGAG AGCGTGGATC CGATGCCCTA CCTCCAGTAG

Protein sequence

MFHRPTRAGA LCMTATLTIL AACSTSDLDW DLRGRPGGLS TAEAARAVSA PRPRADDRGI 
ISYPTYQVAV ARQGETVASL SSRLGLDATQ VASYNALSPQ NPLRAGEVVV LPQRVAAAPA 
MTPAPVMTAP GAASPGGIDV TAIATSALDR AGPAPAPVAA APAAAPAQSA ATEPARHRVS 
RGETAYSIAR SYNVSPKALA DWNGLGPDLA IREGQYLMIP TASAPPPTVP ANVTAVTVPG 
AGSPTPTPPS AAKPLPAEST TPASKPSGQP ASPDMGAQRT QASASRLGFP VQGKIIRGYV 
KKKNDGIDIS AAVGTPVAAA ADGTVAAITQ DTDQVPILVI RHPDNLLTVY ANIDGIKVTK 
GASVKRGQPI AVVRAADPPF VHFEVRKGFE SVDPMPYLQ