Gene RoseRS_1998 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_1998
Symbol
ID	5208960
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	2476726
End bp	2478537
Gene Length	1812 bp
Protein Length	603 aa
Translation table	11
GC content	61%
IMG OID	640595605
Product	pepF/M3 family oligoendopeptidase
Protein accession	YP_001276334
Protein GI	148656129
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1164] Oligoendopeptidase F
TIGRFAM ID	[TIGR02290] oligoendopeptidase, pepF/M3 family

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0556432
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACTAT CAGTCAGTGA ACCACTGCCT CATTGGGATA TGACGGTCGT CTATCCCGCG 
CTCGATTCGC CGGAGTTCAA CCACGACCTT ACGGCGACAC GTCAGGCGTT CGACACGATG 
ACCTCGCTGT TCGACCGTCT GGGAATTAAC AGGCGCGACC GGCAATCGAC CGATGACGCT 
GCTGTCGCCG CATTCGAAAC GGTTGTTCCG GCGCTGAACG AACTGCTCGA ACAGTTCTCC 
ACCCAGCGCG CCTATGTCTA CAGTTTCGTG GCAACCGACT CACGGAACGA TCAGGCGCAG 
GCAACGTTCA GCATGCTGAT GCGGGAAGGG GTTCGGCTAA CAAAACTGTT GCGGCGATTG 
ACCGCCTGGC TTGGCGGGTT GGATGTCGAA ACGTTGATCC AGCGCTCGAC TATCGCGCGT 
GATCACGCCT ATCTGGTGCG CCGCGCCGCC GAAGAGGCGC GTCACCTGAT GTCGCCTGCC 
GAAGAGGAAC TTGCCGCAGA ACTGGACCTG TCGGGCGGTA TTGCCTGGGC ACGTATGTAC 
CAGAATCTGA CGTCGCAGAT ACTTGTGCCC ATCGAACGCG AGGGGCAGAC AGTCGAACTG 
CCGATGAGTC AGGTGCGCAA TCTGGCGCGC GACCCGGACC GGGCAGTGCG CCGCAGCGCG 
CACGAGGCGG AACTCGCAGC CTGGGAACGC GCAGCGTTGC CGCTCGCATC CGCGCTCAAC 
AGCATCAAAG GGCAGGTGCT CACCCTCAGT CGCCGTCGTC GGTGGGAATC GCCGCTCGAG 
GCATCGCTGT TCGACAATGG CATCGACCGC GCCACGCTCG ATGCCATGAT GACCACAGCG 
CGCGAGTTCT TTCCCGATTT TCGGCGCTAC CTGCGCGCCA AAGCCAGGCT CCTCGGTCTT 
GAACGCCTCG CCTGGTACGA TCTCTTCGCC CCGGTCGGCA GCGGTGGACG CAGCTGGCGC 
TTCAGCGATG CAGAGGCGTT TATCGTGGCG CAGTTCACGC GCTACTCGAC GCGCATGGGC 
GATTTTGCTG CGCGCGCATT CCGCGAACGC TGGATCGACG CCGAACCGCG CGCAGGAAAA 
GTCGGCGGCG CGTTCTGTAT GTCGCTCCGC CGCGATGAGT CGCGCATTCT GCTGAACCAC 
GATCCCACAG CGGACAGCAT GTTTACGCTG GCGCACGAAC TCGGGCATGG CTACCACAAC 
CTCAACCTGG CGCAGCAGAC GATGCTCAAC CGTGATACGC CGATGACCCT GGCAGAAACG 
GCGAGCATTT TCTGTGAGAC GATTGTGCGC AATGCGGCGC TCCAGGACGC CAGCCGCGAT 
GAGACGCTCG AAATCCTCGA GGCGTTCCTC AGCGGCGCGT GTCAGGTGGT GGTTGATATT 
ACGTCACGCT TCCTGTTTGA AACCGCGCTG TTCGAACAAC GCGCCACGCG CGATCTGTCG 
GTCGCCGAGT TGTGCGTGCT GATGATCGAC GCGCAGAAAC AAACGTATGG CGATGCGCTC 
GATGAACAAA CATTGCATCC ATTTATGTGG GCGGTCAAGG GGCACTACTA CAGCAGCGGC 
TTTTCCTTCT ACAATTACCC TTACATGTTC GGCTTGCTGT TCGGGTTGGG GCTGTATGCC 
GCCTATCAGC GTGCGCCCGA CGCTTTTCAG GCGCGCTACG ACGATCTGCT GGCTTCGACC 
GGGCTGGCAA GCCCGCTCGA ACTGGCAGCG CGCATGGAGA TCGATCTGCG CTCACCCGCA 
TTCTGGCGCG CCAGTCTCGA GGTCATTCGC TACGATATTG ATCGCTTCGA GTCGCTGGCA 
GTTGCGACAT GA

Protein sequence

MTLSVSEPLP HWDMTVVYPA LDSPEFNHDL TATRQAFDTM TSLFDRLGIN RRDRQSTDDA 
AVAAFETVVP ALNELLEQFS TQRAYVYSFV ATDSRNDQAQ ATFSMLMREG VRLTKLLRRL 
TAWLGGLDVE TLIQRSTIAR DHAYLVRRAA EEARHLMSPA EEELAAELDL SGGIAWARMY 
QNLTSQILVP IEREGQTVEL PMSQVRNLAR DPDRAVRRSA HEAELAAWER AALPLASALN 
SIKGQVLTLS RRRRWESPLE ASLFDNGIDR ATLDAMMTTA REFFPDFRRY LRAKARLLGL 
ERLAWYDLFA PVGSGGRSWR FSDAEAFIVA QFTRYSTRMG DFAARAFRER WIDAEPRAGK 
VGGAFCMSLR RDESRILLNH DPTADSMFTL AHELGHGYHN LNLAQQTMLN RDTPMTLAET 
ASIFCETIVR NAALQDASRD ETLEILEAFL SGACQVVVDI TSRFLFETAL FEQRATRDLS 
VAELCVLMID AQKQTYGDAL DEQTLHPFMW AVKGHYYSSG FSFYNYPYMF GLLFGLGLYA 
AYQRAPDAFQ ARYDDLLAST GLASPLELAA RMEIDLRSPA FWRASLEVIR YDIDRFESLA 
VAT