Gene Slin_4398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_4398
Symbol
ID	8728158
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	5333791
End bp	5335218
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	53%
IMG OID
Product	Peptidase M23
Protein accession	YP_003389178
Protein GI	284039248
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGTTAA AATTTCCCCA CGCTCCTCAT GTTGTTCGCT GGTCAGTAAT CGGGCTGGTC 
GTCTTTGGCT GGGTGTGGTC AATGCCAGCG GCACAGGCGC AGCAGACAAT GCGTGACCGG 
CAGGTACTGG AGAAAGAGAA AAAACAGAAT CTGGAGAAAA TGAACCAGAT TCGGACCATT 
CTGAAACAGA CAGCTTCCGA AAAACAGGCC GGACTAGGCC AGTTAAAGGC TCTGGACCAG 
CAAATTCAGA CGCAGTCGCA GCAGATTGGG TTGCTTAATA AAGATCTTCA GCTAACCGAA 
TCGGAAATCG CCGAACTCCG GCGAGCTAGT ACAACCCTAT CCAGAGACCT TGATAAACTC 
AGGGATGAAT ACGGCTCCAT GATTTACGCA GCCGATAAGC GCCGACAACA GGTCAATCCA 
CTGGGTTTTT TATTTGCCGC CGATAACTTC AATCAATTGG TTGCCCGTTA TCGCTATTTG 
CGGCAGTACT CCGATGCTCG CCAGAGTCAG GTACGGCAGA TGTCGAACGT TAGGACGATG 
CTGGACGGTA AACAACGGGC CACTCAGCGA AAACGCCAGG AGCAAAAGAA TACGATTGGG 
GCCAAAGTGC AGGAAACCAA AAGTCTTGAA ACCCTTAAGG TAGTTAAAAA CCAGGTTGTT 
AAGGAACTGG GGCAGAAAGA GGCCGAACTG AGAACCGAAC TGGCCGAAAG CCGCCGAGCC 
GTTGGACAAC TTGAAGCGTT GATCAAACGA CTAATTGTCC GGGAAGCCCG CGAACGGGCC 
GAACGTGAAG CTCGCGAACG GGCTGAGCGT GACCGAATTG CCCGGCTTGA AGCCGCCCGC 
AAAGCAGCGG AACGCAAACG AGCTGAAGAC GCCATTGCGG CTGCCGAAAA GGCCGGAGAA 
AAACCCGCCC CGGCCGACGT AGCCAAAGTA GAACGACCCG CAGAACCGGA ACCAGCGCCG 
AAAAAACCGG ATGAACGCCG GAATAATAAC CTCAATGACG AAGAAACGGC ATTGGCTTCG 
TCCTTTACAT CATCGCGGGC GCACCTACCC TGGCCCGTAA CCAAAGGCTT CATTTCTGAC 
CGTTTCGGCC GAAAACCACA CCCGGTCCTT AAGGGGATCT ATGTGGAGAA TCAGGGAGTT 
GATATTCAGA CAAACGCGGG CGAGGGTGTC CGGTCGGTAT ACGATGGCAT TGTACAGGAT 
GTGACCAGCA TGCCGGGTAT GAACAATGTA GTGGCCATTC AGCATGGCGA TTACTTCACG 
GTTTACGCCA AACTTCGCAG CGTATCGGTT CGGGTTGGGC AACGGGTAAA AGCCCGCGAA 
TCAATCGGTA CCGTAGCAAC TGATAAAAAC GGGGTATCCG AAATCCAGTT TCAAATCTGG 
AAGGAGTTTA CCAAACTCAA CCCCGAGTCG TGGCTCACTC CCCGCTAA

Protein sequence

MQLKFPHAPH VVRWSVIGLV VFGWVWSMPA AQAQQTMRDR QVLEKEKKQN LEKMNQIRTI 
LKQTASEKQA GLGQLKALDQ QIQTQSQQIG LLNKDLQLTE SEIAELRRAS TTLSRDLDKL 
RDEYGSMIYA ADKRRQQVNP LGFLFAADNF NQLVARYRYL RQYSDARQSQ VRQMSNVRTM 
LDGKQRATQR KRQEQKNTIG AKVQETKSLE TLKVVKNQVV KELGQKEAEL RTELAESRRA 
VGQLEALIKR LIVREARERA EREARERAER DRIARLEAAR KAAERKRAED AIAAAEKAGE 
KPAPADVAKV ERPAEPEPAP KKPDERRNNN LNDEETALAS SFTSSRAHLP WPVTKGFISD 
RFGRKPHPVL KGIYVENQGV DIQTNAGEGV RSVYDGIVQD VTSMPGMNNV VAIQHGDYFT 
VYAKLRSVSV RVGQRVKARE SIGTVATDKN GVSEIQFQIW KEFTKLNPES WLTPR