Gene Slin_6149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_6149
Symbol
ID	8729930
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	-
Start bp	7455289
End bp	7456830
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	49%
IMG OID
Product	peptidase S41
Protein accession	YP_003390908
Protein GI	284040978
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.451646
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCCA TCGGCTGTCT ACTCCTTTCG TTCTTGTTTT CGTTTAGCGG CCACGCCCAG 
CCAGCCATCG ACTCACTGAA AACCCGGGTC CTGCAACCGT CCGCTATGCA GGCCGATTTT 
CGCTACCTCC GCAAGCTGCT GGAAGAAACA CATCCGGGTT TATATCGCTA CACGCCCAAA 
GCAATCATGC AGGCAAAGCT GGACAGTATT GCCGGTACGC TGACAAAACC GCTTCCGTTT 
TATAAATTTT ACGGGACCAT TGAAGCTCTT ATGGCCGACA TCCGCTGTGC CCATACGCAT 
GCATTACCGG AGAAAAACTG GCGCAATCAA TTCAATAAAG TCCAGAAAAC GAACCCATTT 
TTCATATGGT CTACTCAACA GCGCTTCTTC GTCCTGATGA ACGGCACGAC CGACCAAACC 
ATCAAACCCG GCTTTGAACT ACTTAGTATT AACGGCCAGT CGATGGACGA TATCCGACAG 
CAAATGGACC GACACCATTG GGCCGATGGC TACATCCAAT CATCGAAAAG TCAGATGCGG 
GGTGAATTTT TTGACTTGTT CTATTATTGG TTCGTTGGCC AGCCAGATAC GTTTTCGTTC 
AAATTTCGCA GTCTGACGGG CGACACAGTT CAAGTGAATG CCGAAGCGAA ACCCTACCGC 
GTGTCGTTGC GGCAAATGCT CAAAAATCCC GTCAACAAGC AAATGGTAGC CTGGTATGTC 
AACAAAAAAC AGAAACACCC CTGGCGCCTG TCGTTCCCCG ATACGCTGAC GAACACCGCT 
ATTCTTCGAT TCGACGGATT CGGTGGAGAG GGAGCAAGAA ACAGTACCGA AGCCGTGACC 
GTCTTTCGGG CATTTATGGA TAAGAGTATG GATAAACTTA AAAAGCAACG AACAAAGCAT 
TTGGTCATTG ATGTCAGAGG TAATACGGGT GGGTGGGACA GTCAGGGTAT CGAGTTATTT 
ACCTATCTGA TGAAAACGGA TTCAGCCGTA CCCTATCACA CTCGCCAGCA TAGCATTAGC 
GATGGCACTA ATGGCAGTGA GTTTCTCCAA TTTTCGGACC TCTCCGAAGC CAACCGCAAA 
AACATAAAGA ACGAGTTAAT CCCTGAGGCC GATGGTACGT TTACCCTTAA ACAGGCCAGC 
GACACTGATT CGACGGGCCG AACCCCCAAA CGATATACTC CTAAGCCCAA TCGGTTCAAG 
GGACAAGTTT ATTTGCTGAT GAATGGAGAA AGTGCCTCAA CGGCGTCGGA GTTTCTGGCG 
GTTGCTCATG CCAACAATGT GGGGGTGTTT ATCGGTACAG AATCCGGGGG CGCGTATGAA 
GGGGGGAACG GGGGTAGTTT TATTACCCTT GAACTGCCCA GGTCAGGTAT ACAGGTAACA 
ACACCGCTGG TGTACTACAA CAATGCCGTA CCTGAACCGA AGCAGAAAGG GCGCGGCACA 
CTGCCGGATT ACTACGTGCC CGTTACAATA AATGATTTAC TACTGCACAC CGATTCACAA 
TTTAATTTTG TCGTAACCTT GATTCGGAAG CAACCTCAAT GA

Protein sequence

MKAIGCLLLS FLFSFSGHAQ PAIDSLKTRV LQPSAMQADF RYLRKLLEET HPGLYRYTPK 
AIMQAKLDSI AGTLTKPLPF YKFYGTIEAL MADIRCAHTH ALPEKNWRNQ FNKVQKTNPF 
FIWSTQQRFF VLMNGTTDQT IKPGFELLSI NGQSMDDIRQ QMDRHHWADG YIQSSKSQMR 
GEFFDLFYYW FVGQPDTFSF KFRSLTGDTV QVNAEAKPYR VSLRQMLKNP VNKQMVAWYV 
NKKQKHPWRL SFPDTLTNTA ILRFDGFGGE GARNSTEAVT VFRAFMDKSM DKLKKQRTKH 
LVIDVRGNTG GWDSQGIELF TYLMKTDSAV PYHTRQHSIS DGTNGSEFLQ FSDLSEANRK 
NIKNELIPEA DGTFTLKQAS DTDSTGRTPK RYTPKPNRFK GQVYLLMNGE SASTASEFLA 
VAHANNVGVF IGTESGGAYE GGNGGSFITL ELPRSGIQVT TPLVYYNNAV PEPKQKGRGT 
LPDYYVPVTI NDLLLHTDSQ FNFVVTLIRK QPQ