Gene Slin_5542 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_5542
Symbol
ID	8729315
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	6751317
End bp	6753149
Gene Length	1833 bp
Protein Length	610 aa
Translation table	11
GC content	53%
IMG OID
Product	DNA mismatch repair protein MutS domain protein
Protein accession	YP_003390307
Protein GI	284040377
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCCAG AAACCACTTT TCTCGACCGT CAGCAGGAGT TCACTCAAAA AGAACAGGCT 
GCTCAAAGCA ACTACAATCA ACTGGCCTTC TGGCGGCTTA TCTGGTTTGT TGGTGCCGTT 
GCCGGAGTTT GGCTGCTGGC CCGGTTCGAT CAGCAGCTAG CTGCGGCTGG CGTTTTGCTG 
GTCGGCCTGA TTGGGTTTAT GCTGCTATTG AAAAAGCATC AGACCATTCG TCAGGAACGG 
GATTTGTATC ACCAGTTGGC CTTTGTTAAT CAGGACGAAG TGGCCCGGCT AAAACGCCAG 
TACCTGCGCC CGGAAACCGG CGAACAGTTC TCAAGCCCTA CTCACTCTTA TGCCGGCGAT 
TTAGACGTAT TCGGCAAGCA CTCACTGTTC CGGCTGCTCA ATCGCACACA CACATACGAG 
GGGCAGAGAC GTCTGGCAAA GTGGCTGAAG GCACCTTCTG CCCCAGACGC TATCCGATTG 
CGTCAGGAGG CTGTAGCGGA GCTTAAACCG CAACTGGAAT GGCGTCAGCA GTTGGAAGCG 
CTGGCCTATG CAGAGCCAAC CATCAACCAG TCGCCGGATG CCCTCGTGAA ATGGGCAACA 
GCAGAAAGCG AGCCGCTAGC GGGTTACTTA TCGATTGTCC GTTTTCTCTT TCCCGCCATT 
ACCATAGGTT TGTTTATCGG GTGGCTACTG GGTTACGTTC AGGGAGCCGC CGTGTTGCTG 
GCACTGGCGG GGCATGGTCT TGTGCTCAGT CAAATCTCAG CGCGTGCTAA AGGGGTTAGC 
GAGCAAACAT TCGAAATAGC AACGGCGCTG CGGGCGTATC AAGCGCTGCT TAAGCAAGCC 
GAAGCGGTAA AGGGAGATAC TGTTCGATTG CGCGCCATCC GACAGGCGCT AACATCTGAT 
ACTAAACTAG CTGCTTCGGC AGCCATTGGC CAGCTCGGAC GGCTTACCGA GGGGCTGAAC 
TTCCGCCGAA ATCCTTATTT CGCCTTGCTG ATTGGTGTAG CAACACTTTG GGATATTCAC 
TATTTGATAA AGCTTGAACA TTGGCGACAA ACGCATGGAC CGGCACTCAG TTTGTGGTTC 
GAGGCACTGG GTGAGCTGGA AGCCCTCAAT AGCCTCTGTG GTTTCGCGTA CGCGCACCCG 
TCCTATGCAA CTCCCGAAAT CGTTGATGAT AAGTTTGTAT TGGAATTAAC CTCGGCAGCC 
CATCCGTTAC TAGCAGAAAA TAACAGCGTC GCTAACTCAC TTATTCTGCG TGGTGCCGGA 
CAAACCGTCC TGATTACCGG CTCCAATATG TCGGGGAAAA GCACGTTTCT GCGGACGGTA 
GGTACAAACG TAGTGCTGGC ATTAGCGGGG GGCGTGGTGC GTGCCGAACG CTTTCGGTGT 
TCGCCCGTAC AGGTGTTTAC GAGTATGCGC ACACAGGACT CACTCGAAGA AAGCACATCG 
TCGTTCTACG CCGAATTGAA ACGCCTGCAA ACGCTTATTG GCCTGACAAA CCCGGATAAG 
TCGGCCTCAG TTTCTTCTAA AAATACCCTG CCTGTTCTCT ATTTTCTGGA TGAGATCCTG 
AAAGGTACGA ACTCCGCCGA CCGCCATCGG GGCGCTGAGG CCCTTATTCG TCAGTTGCAC 
CACACAATGG CATCTGGCTT TGTGTCTACC CATGATCTTG AGCTGGGTCA ACTTACCGAT 
GCTGACGGCT TTGTGCGTAA CTACCACTTC CAGTCGGACC TTGTCAATGG CGAGCTTGTG 
TTCGACTATA AACTCCGGGA TGGTATCTGC AAAAGTTTCA ACGCCAGCCA GCTGATGCGG 
GCCATTGGCA TTGAGATGGA TGCGGTGAAA TAG

Protein sequence

MPPETTFLDR QQEFTQKEQA AQSNYNQLAF WRLIWFVGAV AGVWLLARFD QQLAAAGVLL 
VGLIGFMLLL KKHQTIRQER DLYHQLAFVN QDEVARLKRQ YLRPETGEQF SSPTHSYAGD 
LDVFGKHSLF RLLNRTHTYE GQRRLAKWLK APSAPDAIRL RQEAVAELKP QLEWRQQLEA 
LAYAEPTINQ SPDALVKWAT AESEPLAGYL SIVRFLFPAI TIGLFIGWLL GYVQGAAVLL 
ALAGHGLVLS QISARAKGVS EQTFEIATAL RAYQALLKQA EAVKGDTVRL RAIRQALTSD 
TKLAASAAIG QLGRLTEGLN FRRNPYFALL IGVATLWDIH YLIKLEHWRQ THGPALSLWF 
EALGELEALN SLCGFAYAHP SYATPEIVDD KFVLELTSAA HPLLAENNSV ANSLILRGAG 
QTVLITGSNM SGKSTFLRTV GTNVVLALAG GVVRAERFRC SPVQVFTSMR TQDSLEESTS 
SFYAELKRLQ TLIGLTNPDK SASVSSKNTL PVLYFLDEIL KGTNSADRHR GAEALIRQLH 
HTMASGFVST HDLELGQLTD ADGFVRNYHF QSDLVNGELV FDYKLRDGIC KSFNASQLMR 
AIGIEMDAVK