Gene Slin_5085 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_5085
Symbol
ID	8728851
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	6220224
End bp	6222473
Gene Length	2250 bp
Protein Length	749 aa
Translation table	11
GC content	54%
IMG OID
Product	catalase/peroxidase HPI
Protein accession	YP_003389859
Protein GI	284039929
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.060305
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAGATC ATATATATCC AAGCGAATCC TCAGATACTA AAAGTTACAA TGTTAATGGC 
GAGAGCAAAT GCCCGTTTAC GGGTGCGACG GCCAAGCAAA GTGCGGGTTC CGGCACGAGA 
AACCGGGATT GGTGGCCTAA TCAGCTTAAG CTAAACGTTC TCCGCCAGCA CTCCCCGCTA 
TCCAACCCTA TGGATAAGGC ATTTAACTAC GCTGAGGCTT TCAAATCGCT GGATCTGAAT 
GCGGTAAAGA ACGACATTTT CGATCTGATG ACCACATCTC AGGACTGGTG GCCAGCCGAT 
TACGGTCACT ATGGCCCTTT CTTCATCCGG ATGGCCTGGC ATAGCGCGGG TACGTATCGA 
ATTGCCGATG GCCGTGGTGG AGCAGGTTCG GGAACCCAGC GCTTTGCCCC CCTGAACAGT 
TGGCCCGACA ACGCAAACCT CGACAAGGCA CGCTTACTGC TATGGCCTGT CAAGAAAAAA 
TATGGTAGAA AGATTTCGTG GGCCGATCTG ATGATTCTTG CTGGTAACTG CGCGCTTGAG 
TCGATGGGTT TCAAAACATT CGGTTTCGCC GGTGGACGGG AGGATGTTTG GGAACCGGAA 
GAAGATATTT ACTGGGGTGC TGAAACCGAA TGGCTGGGCG ACAAGCGCTA TTCTGGTGAC 
CGCGAACTGG AAAATCCGCT GGCTGCCGTA CAGATGGGTC TTATTTACGT AAACCCTGAA 
GGACCCAACA GTAGACCGGA CCCGCTGGCA TCTGCCCGCG ACATTCGGGA AACCTTTGGC 
CGCATGGCCA TGAATGACGA AGAAACGGTT GCGCTTATTG CCGGTGGACA TACCTTTGGT 
AAAACGCACG GCGCAGCTGA TCCGGGCCAG TATGTAGGGG CAGAACCTGC CGGTGCTGGT 
ATTGAAGAAC AAAGCCTGGG CTGGAAAAAC ACCTTCGGAA CCGGTAACGC CGGAGACACC 
ATCACCAGCG GTCTGGAAGG AGCCTGGACC ACAACGCCAA CGCAGTGGGA TAACAACTAC 
TTCGACAATC TGTTCGGGTT CGACTGGGAG CTGACCAAGA GCCCGGCCGG TGCGCATCAG 
TGGAGACCGA AAGATGGCGC CGGCGCCGGT ACCGTGCCCG ATGCACACGA CCCGGCCAAG 
CGCCATGCAC CCATGATGTT TACGACTGAC CTCGCCCTGC GGATGGACCC TATTTATGAG 
CCTATCTCAA GACGTTTTCA CGAAAATCCA GATCAATTTG CCGACGCCTT TGCCCGTGCC 
TGGTTTAAGC TGACTCACCG CGATATGGGC CCGATTGCCC GCTATCTCGG TCCCGAAGTA 
CCCACCGAAG AACTGATCTG GCAAGATCCA ATCCCGGCCG TTACGCATCC TTTGATTGAT 
GAACAGGATA CGGCTGCATT GAAAAAAATG ATACTGGCTT CGGGCCTGTC TGTTTCTCAA 
CTGGTATCTA CCGCCTGGGC CTCTGCATCG ACTTTCCGTG GGTCCGATAA ACGCGGTGGT 
GCCAATGGGG GACGCCTTCG GCTGGCACCG CAGAAGGATT GGGATGTCAA CCATCCGGGT 
CTGCTGGCAA CTGTACTGGA AAAGTTGGAA GGTATTCAAA TCGACTTCAA CAGTATGCAA 
CAGGATGGAA AGCAGGTTTC TCTTGCGGAC CTGATCGTGC TGGGTGGCAG TGTAGGTATT 
GAGCAAGCGG CTAAAAAAGC TGGTCATGAG GTGACAGTAC CGTTCACGCC CGGACGCGCC 
GATGCATCGC AGGAACAGAC CGATGTTGAG TCGTTCGCCG TTTTGGAACC GGAATCAGAC 
GGTTTCCGCA ACTACTCCAA GACGAAATAC ACCGTGTCGG CAGAAGAAAT GCTGATTGAT 
AAAGCACAAT TACTAACGCT GAACGCCCCA GAAATGACCG TTCTGGTTGG CGGCATGCGG 
GTTCTGAACA CGAACTACGG TTTTTCCAAA CACGGTGTAT TTACAAAGCG CCCGGAGGCC 
CTTACCAACG ACTTTTTCGT TAACCTGCTC GATCTCGGTA CGACCTGGAA GGCAGCCTCG 
CAACACCAGG ATGTGTTTGA AGGCCGTGAC CGGACAACAG GCGAATTGAA ATGGACTGGT 
ACCCGAGTCG ATCTTATTTT TGGTTCTAAT TCAGAACTCC GGGCACTTGC TGAAGTGTAC 
GCCTGCGAAG ATGCACAGGA GCAGTTTGTA CAGGATTTTG TAGCGGCATG GACCAAAGTG 
ATGAATCTCG ATCGCTTCGA TCTGGCCTGA

Protein sequence

MGDHIYPSES SDTKSYNVNG ESKCPFTGAT AKQSAGSGTR NRDWWPNQLK LNVLRQHSPL 
SNPMDKAFNY AEAFKSLDLN AVKNDIFDLM TTSQDWWPAD YGHYGPFFIR MAWHSAGTYR 
IADGRGGAGS GTQRFAPLNS WPDNANLDKA RLLLWPVKKK YGRKISWADL MILAGNCALE 
SMGFKTFGFA GGREDVWEPE EDIYWGAETE WLGDKRYSGD RELENPLAAV QMGLIYVNPE 
GPNSRPDPLA SARDIRETFG RMAMNDEETV ALIAGGHTFG KTHGAADPGQ YVGAEPAGAG 
IEEQSLGWKN TFGTGNAGDT ITSGLEGAWT TTPTQWDNNY FDNLFGFDWE LTKSPAGAHQ 
WRPKDGAGAG TVPDAHDPAK RHAPMMFTTD LALRMDPIYE PISRRFHENP DQFADAFARA 
WFKLTHRDMG PIARYLGPEV PTEELIWQDP IPAVTHPLID EQDTAALKKM ILASGLSVSQ 
LVSTAWASAS TFRGSDKRGG ANGGRLRLAP QKDWDVNHPG LLATVLEKLE GIQIDFNSMQ 
QDGKQVSLAD LIVLGGSVGI EQAAKKAGHE VTVPFTPGRA DASQEQTDVE SFAVLEPESD 
GFRNYSKTKY TVSAEEMLID KAQLLTLNAP EMTVLVGGMR VLNTNYGFSK HGVFTKRPEA 
LTNDFFVNLL DLGTTWKAAS QHQDVFEGRD RTTGELKWTG TRVDLIFGSN SELRALAEVY 
ACEDAQEQFV QDFVAAWTKV MNLDRFDLA