Gene Rmar_1971 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmar_1971
Symbol
ID	8568628
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodothermus marinus DSM 4252
Kingdom	Bacteria
Replicon accession	NC_013501
Strand	+
Start bp	2298481
End bp	2299665
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	68%
IMG OID
Product	Peptidase M23
Protein accession	YP_003291242
Protein GI	268317523
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.324427
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGCGTC TGCTGCTCTG CCTGCTGTTG ATGATGAGCG CAGGGACGGC CCTGGCCCAG 
CAGGACCGTA CCGAGATCGA ACGCCGCCTG CAGGCGCTCC GCGAGCAGAT TCGTCAGGAA 
GAAGCCCGTC TGGCCGAAAC GGCCGAGGCC GAACAGGCCA CGCTGCAGAC GCTCGAAAGC 
ATCGAACGCC AGATCGCCAT CCGTCGCGAG CTGATCCGGA GCTACCGGGA GCGGCTGGAA 
GAGCTGGCCC GCACGATCGA CTCGCTGCAG CAGGCCGCCC GGGCGCTCAG CCAAGAGATC 
GAAAAGCTGA AAGCGCAGTA TCGCCGCCGG GCGCTGCACG CCTACAAATA CGGCCGCATG 
CACGAGCTGG CCCTGCTGCT CTCGGCGCAG TCCATCAACC AGATGCTCAT CCGTGCCCGC 
TACCTGAGCC GCTTTGCACG GCAACGACAG GCCAAGCTCG AAGCCATTCA GCAGGCGACG 
GCCGCTCTGG AAGCCCGTCG CCAGGAGCTG CTGGCCGCCC GCCAGGAAAC CGAGCAGTTG 
CTGCAGGAGG CCGAGGCCGA GCGGCAACGC CTGGCGCGTC TGGAGCGCGA GCGCCGCCGC 
GTGATCGAAG CGCTCCGCGC CCAGCGCGTC TCGCTGGAGC AATCGCTGGC CCAGAAACGC 
CAGGCCGCCC GCGAGCTGGA GTCGCGCATC CAGGCGTTGC TCGCAGCCGA ACGGGAGCGG 
CAACGCGCCC GCGAAGCGGC CGATCCGTCG GCCGCTGTGG CTTTTGCCGA GCTGACCGGT 
TCGTTCGAGC AGAACCGCGG GCGGCTGCCC TGGCCGGCCG AAGGCGCCGT CGTCGAACCC 
TTCGGCGAAG TGGTCAACCC CGTCTATGGC ACGCGCACGC CCAATCCCGG CATCCTGATC 
GCCACCGCCC CCCAGGCCGA GGTGCGGGCC GTCTTCGACG GCCGCGTGAT CGCCATCGAC 
GCCATGCCGG AGTACGGCAC CTACATCCTC ATCCAGCACG GCGAATACCA GACGTTCTAC 
AGCAACCTGT CGCTTGTGTA CGTGTCGATC GGCCAGGAAG TACGGGCCGG ACAGGTCATC 
GGCCGGGCCG GCACCGACGC CGAACCCAAA CGCGCCGGCG TGTTCTTCTC GCTCTTCCGG 
GGTGGCCAAG TGCTCAATCC CATGCCCTGG CTTCGTCCAC GCTGA

Protein sequence

MRRLLLCLLL MMSAGTALAQ QDRTEIERRL QALREQIRQE EARLAETAEA EQATLQTLES 
IERQIAIRRE LIRSYRERLE ELARTIDSLQ QAARALSQEI EKLKAQYRRR ALHAYKYGRM 
HELALLLSAQ SINQMLIRAR YLSRFARQRQ AKLEAIQQAT AALEARRQEL LAARQETEQL 
LQEAEAERQR LARLERERRR VIEALRAQRV SLEQSLAQKR QAARELESRI QALLAAERER 
QRAREAADPS AAVAFAELTG SFEQNRGRLP WPAEGAVVEP FGEVVNPVYG TRTPNPGILI 
ATAPQAEVRA VFDGRVIAID AMPEYGTYIL IQHGEYQTFY SNLSLVYVSI GQEVRAGQVI 
GRAGTDAEPK RAGVFFSLFR GGQVLNPMPW LRPR