Gene Slin_5663 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_5663
Symbol
ID	8729437
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	6898077
End bp	6899864
Gene Length	1788 bp
Protein Length	595 aa
Translation table	11
GC content	50%
IMG OID
Product	RNA binding S1 domain protein
Protein accession	YP_003390427
Protein GI	284040497
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.726551
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAAA CGCAGCAACG CGAACTGCCG GCATTTGATT GGGACCGGGC AGACAACAAA 
GGGTTTGGAA GCGGCTATTC GGTTGAAGAA CACAACCGGA TGTTAGAACT TTACGACAAC 
ACACTGTCGG AAGTTAAAGA GAAAGAAGTG GTAATGGGAA CCGTCGTTGG GATAACGGAT 
CGGGAAGTAC TACTCAACAT CGGCTTCAAG TCGGATGGCT TAGTGCCAGC TTCTGAATTC 
CGGGATATGC CGGACCTGAA GATGGGTGAT GAAATTGAAG TTTACGTAGA AAATCAGGAA 
GACCCGAACG GTCAGCTGGT GCTTTCTCGC AAAAAGGCGA AAGTGATCAC TGCCTGGCAG 
AAAATCCAGC GTGCTCTGGA CGAAGACCTC GTTATCGATG GTTTCGTTAA GCGCCGGACA 
AAGGGTGGCC TGATCGTTGA TATTTTCAGC ATTGAAGCGT TCTTGCCAGG TTCGCAGATC 
GACGTGAAGC CAATTCGCGA TTTCGACATC TTCGTTGGTA AGAAAATGGA GGTTAAAGTC 
GTTAAGATCA ACTATGCAAA TGACAACGTA GTCGTTTCGC ACAAAGTCCT GATCGAGAAA 
GACCTCGAAG CACAACGTGC ACAAATCCTG AACAACCTCG AAAAAGGTCA GGTACTGGAA 
GGCGTTATCA AGAACATGAC CAACTTTGGT GTGTTCATCG ATCTTGGTGG CGTAGATGGT 
CTGTTGCACA TCACGGATAT TTCGTGGGGT CGTATCAGCC ACCCATCCGA AGTACTGCAC 
CTCGACCAGA AAGTCAACGT GGTTGTACTC GACTTCGACG AAGACAAGAA GCGTATTTCG 
CTGGGCATGA AGCAACTTCA GGCTCACCCA TGGGATGCTC TGGTTGAAGA CATTCAGGTT 
GGTTCGAAAG TGAAAGGTAA AATCGTGAAC GTAGCTGATT ACGGCGCGTT CCTCGAAATT 
CAGCCTGGTG TTGAAGGCCT GATCCACGTA TCAGAAATGT CGTGGTCGCA GCACCTGCGC 
AACCCACAGG AATTCCTGAA AGTTGGTGAC GAAGTAGAAG CACAAGTGCT GACGCTGGAC 
CGTAACGACC GTAAAATGTC GTTGGGCATC AAACAACTGA CGGAAGATCC ATGGACTCGT 
CCGGAACTGC GCACCAAATA CGCCGTTGGC ACCAAGCACA AAGGCATGGT ACGTAACCTG 
ACAAACTTCG GCCTGTTCCT CGAACTGGAA GAAGGTATCG ATGGTCTGGT ACACGTGTCT 
GACCTGTCGT GGACGAAGAA GGTGAAACAT CCTTCGGATT TCATTAAGGT TGGCGACGAA 
CTCGAAGTGC TGGTACTTGA ACTGGATGTT GACAACCGTC GTCTGGCGCT GGGTCACAAG 
CAACTCGAAG AAAATCCTTG GGATACGTTC GAAACCGTAT TCGCCGTTGG TACCGTACAC 
CGTTGCACAA TTCTGAACAA GAACGACAAG ATGGCTACCC TCGAACTGCC GTATGGTATC 
GAAGGTTTCT CGTCACTCAA GAATCTGGGC AAAGAAGATG GTACCTTCGC TGAAGTTGGC 
GAAACGCTTG ACTTCAAAGT AACGGAATTC TCGAAAGAAG AGAAGCGTAT CATGCTCTCG 
CACACGAAGA CGTGGCAGGA GAAGAACGAG CCAGTAAAAG AGCAGAAAGC ACCTAAGGCC 
GCTCCGGCAA AATCGTCGTC CGCACCAGCT CAGGCTGAGC GTGGCGCTAC GCTGGGTGAT 
CTTGATGCAC TGGCTGCATT GAAAGAGCAA CTGGAAGGCC GCAACTAG

Protein sequence

MSKTQQRELP AFDWDRADNK GFGSGYSVEE HNRMLELYDN TLSEVKEKEV VMGTVVGITD 
REVLLNIGFK SDGLVPASEF RDMPDLKMGD EIEVYVENQE DPNGQLVLSR KKAKVITAWQ 
KIQRALDEDL VIDGFVKRRT KGGLIVDIFS IEAFLPGSQI DVKPIRDFDI FVGKKMEVKV 
VKINYANDNV VVSHKVLIEK DLEAQRAQIL NNLEKGQVLE GVIKNMTNFG VFIDLGGVDG 
LLHITDISWG RISHPSEVLH LDQKVNVVVL DFDEDKKRIS LGMKQLQAHP WDALVEDIQV 
GSKVKGKIVN VADYGAFLEI QPGVEGLIHV SEMSWSQHLR NPQEFLKVGD EVEAQVLTLD 
RNDRKMSLGI KQLTEDPWTR PELRTKYAVG TKHKGMVRNL TNFGLFLELE EGIDGLVHVS 
DLSWTKKVKH PSDFIKVGDE LEVLVLELDV DNRRLALGHK QLEENPWDTF ETVFAVGTVH 
RCTILNKNDK MATLELPYGI EGFSSLKNLG KEDGTFAEVG ETLDFKVTEF SKEEKRIMLS 
HTKTWQEKNE PVKEQKAPKA APAKSSSAPA QAERGATLGD LDALAALKEQ LEGRN