Gene Slin_3221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_3221
Symbol
ID	8726974
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	3900765
End bp	3902573
Gene Length	1809 bp
Protein Length	602 aa
Translation table	11
GC content	46%
IMG OID
Product	excinuclease ABC, C subunit
Protein accession	YP_003388031
Protein GI	284038101
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.119299
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.0605848
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGAAT TTGATTACAA GCAAGAGTTA GCCAAAGTAC CACACGAACC GGGCGTCTAC 
CGGTATTTTG ACGCAACGGG CGAGGTAATT TATGTTGGTA AAGCCAAAGA CCTGAAAAAC 
CGGGTTAGTA GTTATTTTAC CAATTCAAAA GGGCACGATC GCAAAACCCT GCGGCTGGTA 
AGCCAGATTC GAAAGATTGA GTTTACCATC GTCAACACTG AATTTGATGC CTTGCTGCTC 
GAAAATCAGC TGATCAAGCG GTATCAGCCC AAGTTTAACA TTTTACTGCG CGACGATAAG 
ACCTATCCGT TCGTATGTGT CACAAATGAG CACTTTCCGC GGGTTGTAAC GACCCGGCGA 
ATCGACCGTA AACTCGGTAC TTTTTACGGC CCTTTCGCGA ACTTAAAGCC CATGTACACC 
GTGCTGGATA TGTTCAGCCA GCTGTTTACG ATCCGAACGT GTAATTATAA CCTCGCTCCC 
GAGAACATCG AAGCCGGGAA GTATAAAGTT TGTCTGGAAT ACCACATTGG TAATTGCAAA 
GGCCCATGTG AAGGCAAACA GGCTGAAGAA GACTACAACT CAGATATTGA ACAGGTCCAC 
CATATTCTGA AAGGCAACCT AAAGCCTGCT CAGGAGTACT TCAAGAACCA GATGGTTGAA 
GCAGCCAATG ATCTGGCATT TGAGCAGGCA CAGAAGTATA AAGATAAAAT GGAAGTGCTG 
CAGCGGTTTC AAAGTAAATC GACTGTTGTT AATCCGAAAA TTGCCGATGC GGATGTGTTC 
TCCATTGCGT CAGATGAGGT TTCAGCTTAC ATCAACTTTA TGAAAGTGGT TAACGGAACC 
ATCGTCCAGA CGCACACCGT AGAAATCAAG AAAAAGCTCG ACGAAACGGA CCAGGACTTG 
ATGGCTATGA TGATCATTGA GTTTCGGGAT CAGTATGGCA GTCAGGCAAA GGAAATTATA 
TCGAATATAC CTCTCGATGT TGATTTAAAA GCGGAGGTAA CCGTTCCGCA GATTGGCGAC 
AAAAAGAAAC TGCTCGATAT GTCCCTTAAA AACGTGCTTT ATTTCCGGCG CGAAAGGCAG 
GAGCGAGCAG CCGCTGAAGC AACGGCCAAT GCCAGTAAAA AAGATCGTGT GTTGATCCGG 
CTGAAACAGG ATTTGCAGCT AAAAACATTG CCGAACCGTA TTGAATGCTT TGACAACTCA 
AACATTCAGG GCACAAATCC TGTATCGGCA ATGGTATGTT TTATTGGTGG AAAACCCGCG 
AATAAAGAGT ACCGCCACTT TTCTATTAAG ACTGTTATTG GGCCAAACGA CTTCGCAAGT 
ATGTATGAAG TCGTTACACG ACGGTATACA CGCGTTTTAA CGGAAGATAC CGGCCTTCCT 
GACCTGATTG TCATTGATGG TGGCAAAGGC CAGCTCAGTG CCGCCTGCGA CGCGTTAAAA 
GACCTCGATC TATATGGTAA AGTGCCAATT ATCGGTATTG CCAAACGGCT TGAAGAGATT 
TACTTTCCGG AAGACAACTT ACCACTCTAC ATCGATAAAA AGTCCGAGTC GCTCAAACTT 
ATCCAGCGCA TACGCGATGA GGCTCACCGG TTTGCTATTA CCTATCACCG GGATAAACGC 
AGCCGCAACA GCCTGATCAG TGAACTGGAG AATGTAGAAG GGGTCGGCAA GAAAACAGCG 
GCCAAGCTTT TGAAGCATTT TAAAGGCGTC ACCAAAATTC GGGAGGCCAG CTTTGATGAA 
GTGGCCGAAG TTGTGGGTAA AGACCGTGCG GTTAAGCTAA AACAGTATTT TGACACTATT 
GAACAATAA

Protein sequence

MPEFDYKQEL AKVPHEPGVY RYFDATGEVI YVGKAKDLKN RVSSYFTNSK GHDRKTLRLV 
SQIRKIEFTI VNTEFDALLL ENQLIKRYQP KFNILLRDDK TYPFVCVTNE HFPRVVTTRR 
IDRKLGTFYG PFANLKPMYT VLDMFSQLFT IRTCNYNLAP ENIEAGKYKV CLEYHIGNCK 
GPCEGKQAEE DYNSDIEQVH HILKGNLKPA QEYFKNQMVE AANDLAFEQA QKYKDKMEVL 
QRFQSKSTVV NPKIADADVF SIASDEVSAY INFMKVVNGT IVQTHTVEIK KKLDETDQDL 
MAMMIIEFRD QYGSQAKEII SNIPLDVDLK AEVTVPQIGD KKKLLDMSLK NVLYFRRERQ 
ERAAAEATAN ASKKDRVLIR LKQDLQLKTL PNRIECFDNS NIQGTNPVSA MVCFIGGKPA 
NKEYRHFSIK TVIGPNDFAS MYEVVTRRYT RVLTEDTGLP DLIVIDGGKG QLSAACDALK 
DLDLYGKVPI IGIAKRLEEI YFPEDNLPLY IDKKSESLKL IQRIRDEAHR FAITYHRDKR 
SRNSLISELE NVEGVGKKTA AKLLKHFKGV TKIREASFDE VAEVVGKDRA VKLKQYFDTI 
EQ