Gene Slin_5951 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_5951
Symbol
ID	8729732
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	7214178
End bp	7215458
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	49%
IMG OID
Product	peptidase M16 domain protein
Protein accession	YP_003390712
Protein GI	284040782
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCTCG ATAGAACACA ATCGCCCGGA TTTCAGGCTA TACAGGAAAT ACGCCTGCCA 
GCAGTACAGT CTCACCAACT GGATAACGGA ATTCCGCTGC ACCTGATTTC GGTTGCTCAG 
CAGCCTGTTT TGCGGCTGGA GTGCGTATTT AATGCGGGAA CCTGGTATGA ACAGGTGCCA 
GGTAGCGCAT TTTTTGCCAT GAAGATGCTG GCGGAAGGTA CACCCACACG TACATCTGCC 
CAAATTAGCG AGTACATCGA CCGATACGGC GCTTTCCTGG AACTTAACAG CGGCCCCGAC 
CGTGCCAGTA TTGTCATTTA CTGCCTCAGC AGGTTTTTGC CAAATGTGCT GCCTGTGCTT 
CGGGAGATGC TTACTGAAGC TACCTTCCCG CAAAAAGAAC TGGACGACCT GCGGAACATC 
ACCCTCCAGA ACCTGCGCGT CAATTACGAG AAGAATGCTT ATCTCGCCGG GGTTCTGTTC 
CGGGAAAAAT TGTTTGGTAT CAACCACCCA TACGGGCGTA GTCAACGTCC CGAAAATGTC 
GAAAAGCTTA CCCGGCAGGA TGTAGTTGAC TTCTTTAGTC AGGTTATCAG TAACCGGCCT 
TTTCAGATAA TTCTGGCCGG GCAGGCCGCT GAAGATGAAC TGGCCGCGAT TAACCGTGAA 
CTAGGGCAGT TAACTCTTCG TACAGACGCA CTCGCGGCAT TTGACGGAAG CGCCTATTCC 
GACGACCGGT TGCCCATACT GGCTGATAAA CCGGACAGCG TTCAATCGTC AATCCGCGTT 
GGTCGCCGGT TGTTTACCCG GTCACATCCT GATTTCTTTA AAATGCTTGT TACCAATGAA 
ATCTTGGGCG GGTACTTTGG CTCCCGGCTC ATGAAGAATA TTCGTGAAGA GAAAGGATTT 
ACGTACGGAA TCTCATCGAA TATGCCTTCG TTCCGGCAGG ATGGGTATTT CCTGATCGGA 
ACGGATGTTA ACAAAGAAAA TACCCAGCAA ACGCTGGATG AGATCAGAAA GGAGATAAGT 
ATCCTGCAAA CCGAGCCGGT ATCAGCGGAT GAACTGGAAA CAGTACAGAA TTATATGGCA 
GGCGAATTTG TTGGATCATT GAATACACCC TTCGAAATTG CTGACCGGTA TAAAGTGGTT 
TTACTGGATG GAATGCCCAC AGATTTCCTG ACAACGTATA TTCAAAAAAT TCGTCAGGTA 
ACCCCAGCCG ATGTAATGGA GACAGCTAGC CGCTATCTGG CCCCCGAGGA TTTACGGGAA 
GTAGTCGTAG GTGGTAAATA G

Protein sequence

MTLDRTQSPG FQAIQEIRLP AVQSHQLDNG IPLHLISVAQ QPVLRLECVF NAGTWYEQVP 
GSAFFAMKML AEGTPTRTSA QISEYIDRYG AFLELNSGPD RASIVIYCLS RFLPNVLPVL 
REMLTEATFP QKELDDLRNI TLQNLRVNYE KNAYLAGVLF REKLFGINHP YGRSQRPENV 
EKLTRQDVVD FFSQVISNRP FQIILAGQAA EDELAAINRE LGQLTLRTDA LAAFDGSAYS 
DDRLPILADK PDSVQSSIRV GRRLFTRSHP DFFKMLVTNE ILGGYFGSRL MKNIREEKGF 
TYGISSNMPS FRQDGYFLIG TDVNKENTQQ TLDEIRKEIS ILQTEPVSAD ELETVQNYMA 
GEFVGSLNTP FEIADRYKVV LLDGMPTDFL TTYIQKIRQV TPADVMETAS RYLAPEDLRE 
VVVGGK