Gene Slin_1888 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_1888
Symbol
ID	8725625
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	-
Start bp	2282765
End bp	2284249
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	48%
IMG OID
Product	peptidase S41
Protein accession	YP_003386732
Protein GI	284036802
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.389553
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACAAC ACGTTGTGAA CAAAGCCCAA CGGGCAACTT TAAATCAGGT GATCGGGCAA 
CATAAATCCT TACTGGTCGT CGTGCTGCTT GGTTTTATTG GGTCCTTATC GGGCTGTAAG 
AAAACGACCG ATGACGTTAC CCCGCAAACG ACGACGGCCA CGGTCAACGA AAACACTACG 
GTCGATAGCT GGATACTGGC CAACATGAGA GATCTGTATT ACTGGAACGA TAAAATTCCG 
GCTAATCCCG ATACGACCCT GGCTCCCGAT GTTTTCTTCG ATTCTATTCT GAACAAATAC 
AACGCCACGA CGAATCCTAC CGGCGACCGT TTTTCGTGGA TAGAAAACGA TGCAAATACG 
TTGACGGCCG AGTTAAGTGG CGAATCAACG ACAACCGGTA TGAATTTCAA TCTTTACCTG 
CGGGCATCAG GCTCAACGGG GGTTATCGCC CAGGTGCTGT ACGTATCGCC CGGCTCTCCG 
GCAGAAAAAG CGGGGTTGAA ACGGGGCGAC GTCATTACCA AAGTGAATGG CCAGTTACTC 
AACACCACGA ATTATTCGGA TCTGTTATTT ACGGGCACGA CGTTTACGTA CGGGCTGGGT 
ACAGTAAGCG GTAATTCAAT CGTTGATTCT GACCAGACCC GCAGCGTAAC GGCGATAGTG 
TTTCAGGAAA ACCCCGTGTT TCTGGACTCG ATCTATACGG TTGGTTCTAA AAAAGTCGGA 
TATCTGGTCT ACAATCAGTT TGTTCCCGGT GCGAATGGCA GCAAAGCCAA CGAATATGAT 
GCGCAGGTCG ATGCCATATT CAGTAAATTC AAATCCCAGG GGGTCAATGA ACTGGTGCTG 
GATTTACGGT ATAACCCGGG CGGCTATACG TCCTCGTCTG CCAATCTGGC CAGCCTGATC 
GGAAAGGGTA TTAACTCCAG TAAACTTTAT TTCCGTGAAG AATGGAACAG CACCATTACT 
CCTTATTTGC AGAAGGAGTA CGGCAGCAGC TTCTTTATTC AGAACTTCCT TGATAAACCC 
CAAAACATAG GCAATAACCT ATCACGGGTA TTTGTTCTCA CAACGGATCA AACTGCTTCG 
GCCAGTGAGT TAATTATCAA TGGTCTTCGC CCGTACATGA CCGTCACAAC GATTGGCACG 
ACCACGTACG GCAAAAATGT GGGCTCGATC ACCGTTACCG ATGAGACTGG CAAAATTAAG 
TGGGGAATGC AACCCATTGT GTTCAAATCG TACAACAATG CAGGCCAGTC TGACTACTCA 
ACAGGGTTTA CGCCCAACAT TGAGGTCGAC GAAACGATGC CGCTGTTACC ACTGGGCGAT 
ACGAACGAAA ACTTGCTGAA CGCAGCCCTG AATCAGATTT CGGGAAATGT TGCTGGCGGG 
CGCCGGGCGG CTGTACGAAA TCCATTTATA CAGATGGGTT CATCAATTCA GCGGAAAGCC 
GGTGGTCAAT CCATGATACG GGCAATAAAG AACCTGAAAT TATAA

Protein sequence

MKQHVVNKAQ RATLNQVIGQ HKSLLVVVLL GFIGSLSGCK KTTDDVTPQT TTATVNENTT 
VDSWILANMR DLYYWNDKIP ANPDTTLAPD VFFDSILNKY NATTNPTGDR FSWIENDANT 
LTAELSGEST TTGMNFNLYL RASGSTGVIA QVLYVSPGSP AEKAGLKRGD VITKVNGQLL 
NTTNYSDLLF TGTTFTYGLG TVSGNSIVDS DQTRSVTAIV FQENPVFLDS IYTVGSKKVG 
YLVYNQFVPG ANGSKANEYD AQVDAIFSKF KSQGVNELVL DLRYNPGGYT SSSANLASLI 
GKGINSSKLY FREEWNSTIT PYLQKEYGSS FFIQNFLDKP QNIGNNLSRV FVLTTDQTAS 
ASELIINGLR PYMTVTTIGT TTYGKNVGSI TVTDETGKIK WGMQPIVFKS YNNAGQSDYS 
TGFTPNIEVD ETMPLLPLGD TNENLLNAAL NQISGNVAGG RRAAVRNPFI QMGSSIQRKA 
GGQSMIRAIK NLKL