Gene Rmar_1037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmar_1037
Symbol
ID	8567678
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodothermus marinus DSM 4252
Kingdom	Bacteria
Replicon accession	NC_013501
Strand	+
Start bp	1185077
End bp	1186570
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	68%
IMG OID
Product	peptidase M20
Protein accession	YP_003290318
Protein GI	268316599
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGATGA TGCGCAAGCC GCTGCTGAAA GTCCTGATCG GAGCACTCGG GCTGTTGCTC 
GTGCTGATCG TCGTGCTGCT GGTGCGGGCC TGGCGGGTTG GGCAGCAGGT TGAATCGACC 
GAAAATCTGG AGCCGCTGCA GCTCACGCTC GATGCGGAGG CGCTGGCGCA GCGGCTGGCC 
GGTGCACTCC GGTTTCCCAC CGTATCCAAT CAGGATCCGG CGCGCATCGA CAGCAGTGCG 
TTTCGGGCAC TGCACACCTA CCTGAAAGAA AATTTTCCGC AGGTACACGC CCATCTCCGT 
CGGGAGATCA TCGGTGGGCT GAGCCTGCTT TACACCTGGC CGGGACAGGA CACGACGCTG 
CCGGCTGTGG TCTTCATGGG GCATCAGGAC GTGGTGCCGA TTGCCACGCC GGAAGCCTGG 
ACACACCCGC CGTTCGGCGG CGTGGTGGCC GACGGGTTCG TCTGGGGACG TGGAGCGCTG 
GACGACAAGA TCGGCGTGCT GGGCGTGCTG GAGGCCGTCG AGCACCTGCT GGCCGACGGA 
TTCCGGCCCG TGCGAACGGT CTATCTGGCC TTCGGGCACG ACGAAGAAGT GGGCGGGCGG 
CACGGCGCCC GGCAAATCGC CGAGCGGCTG GCGGCGCGAG GCGTCCGGCT GATCGCCGTC 
GTGGACGAAG GCGGCTTCGT GGTGGACGGC GTCATTCCGG GCATGACGCG GCCGGTGGCG 
CTGGTGGGCG TGGCCGAGAA GGGCTACGTG AGTCTGGAGC TGACGGCCAC GGCGCCGGGT 
GGACATTCCT CGACGCCGCC CACGCAGACG GCCATCGGGA CGCTCAGCCG GGCCATCGTG 
ACGCTGGAGG ACAACCCCTT TCCGGCACGA CTCGACGGAC CCACCCGGGG ACTGCTGGAA 
CGGCTGGCGC CTTACGTCAC CTTCGGACCG CGCGTGGTGC TGGCCAACCT GTGGCTTTTC 
GGACCGGTGG TGAAATGGAT GCTGGCCCGC TCGCCGGCCG GCAACGCCAG CCTGCGCACG 
ACGACCGCGC CGACCATCTT CGAGGCGGGC GTCAAAGAGA ACGTACTGCC GACGCAGGCC 
CGGGCCGTGG TAAACTTCCG GATCTACCCG GGCGAAACGG CCGAAAGCGT GGAGCAGCGC 
GTGCGGACAC TGCTCGAAGA CCTGCCGTTG CAGGTGCGCC GGCTCGAAGA GACGGTCACC 
GACCCGTCGC CGGTCTCCGA TTTCGAGGGC GAGGCGTTCC GGCGGGTGGT GGCCGCCATC 
CGACAGGCAC GGGCCGACGC GCCGCCCGTT GTGGCGCCCT ATCTGGTGCC GGGCGCCACA 
GACGCCCGCT ACTTCACGGC ACTGAGCCCG AACGTGTATC GGTTCATCGG CGCGCAGATC 
ACGCCCGAAC TGCTCGCCAC CATCCACGGG GTGGACGAAC GCGTTGCGGT GGACGAATAC 
GTGCAGGCCG TCCGCACCTA CTACGCGTTG ATCCGCGCGC TGAGCGGCCC CTGA

Protein sequence

MRMMRKPLLK VLIGALGLLL VLIVVLLVRA WRVGQQVEST ENLEPLQLTL DAEALAQRLA 
GALRFPTVSN QDPARIDSSA FRALHTYLKE NFPQVHAHLR REIIGGLSLL YTWPGQDTTL 
PAVVFMGHQD VVPIATPEAW THPPFGGVVA DGFVWGRGAL DDKIGVLGVL EAVEHLLADG 
FRPVRTVYLA FGHDEEVGGR HGARQIAERL AARGVRLIAV VDEGGFVVDG VIPGMTRPVA 
LVGVAEKGYV SLELTATAPG GHSSTPPTQT AIGTLSRAIV TLEDNPFPAR LDGPTRGLLE 
RLAPYVTFGP RVVLANLWLF GPVVKWMLAR SPAGNASLRT TTAPTIFEAG VKENVLPTQA 
RAVVNFRIYP GETAESVEQR VRTLLEDLPL QVRRLEETVT DPSPVSDFEG EAFRRVVAAI 
RQARADAPPV VAPYLVPGAT DARYFTALSP NVYRFIGAQI TPELLATIHG VDERVAVDEY 
VQAVRTYYAL IRALSGP