Gene Slin_4089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_4089
Symbol
ID	8727848
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	4922326
End bp	4924605
Gene Length	2280 bp
Protein Length	759 aa
Translation table	11
GC content	47%
IMG OID
Product	capsular exopolysaccharide family
Protein accession	YP_003388875
Protein GI	284038945
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.286783
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAAG GAGAAGTAAG TTACGTATCA TCCGGAGAAA GCAGCTTCAG GCGATTCCTT 
TACAAATACC GGCGTTTCTG GTATCTGTTT GTAATCAGCA TTGGCGCTAG CCTGGTACTG 
GCTGTCCTTT ATTTAAAATC GGCTACCCCG CAATACAATG TCAGTATAAG CCTGTTAATC 
AAAGATATAG AGAAAGGGCC TGACATTCGG CCGGGTAATC CGATTTTTAA AGAGTTGGAT 
ATCTTGAACT CGACAACCAG TATTGAGGAT GAGATCGAAG CGTTAAGATC GGTGACCCTG 
ATGCACCGGG TTTTAACGGA ACTTGGCTTG CAGACCAGTT ATTACGTAGC CGATTCGTTC 
AAGAAAAGGG AGATTTTTGG CGCCGATCTG CCTATCCGTC TATCCGTTAA AACACTCTCT 
CAATCAGCTT ATACAAAGCC GATTGCCATA GTCATTAAAA ACACGCAGGA GTTTCAGCTA 
CAGGACGGCC CCCCCCCTGC CAATACTTAC CGGTTCGGTC AGTTGATCCA ACGTCCTTAT 
GGCACGTTTA CGGTTCAGGC TAATCCGGAA GCCATGCGGT GGCAGCCCAA AAAAATATTT 
ATCTTCTTCA ATAACCTGGA GGATATGGCT GAAAGCTACA GTAAAGCGAC AGCCATTATT 
CAGCTTAATA AAAAAGCAAA TGTTTTGAGT GTATACATGC AGAGTGCCGT TCCGGAGAAA 
GGAAAGGTTA TTCTGAACAA GCTCATTGAG GTATACAATA AAGAGAACAA GGAAGATCGT 
AATATTCTGG CTCTCAATAC GATAAAATTC ATTGAGGAAC GATTAAGAGA CTTAACCGCC 
GAATTATCGG ATATAGAGAA GGCGACCGAG GAGTTCAAAC GCCGAAACCA GGTAACCGAT 
GTTCGCTCCG AAGCAAATGG GTATCTCGAA GAATCCAGAA TTTATAATAA TCAGCTATCG 
GCCAATAAAA TACAACTCGA TATTGCCGAA TCGCTGGAAC GATACCTGGC ACGGCAAAAG 
CAAAAATATG AGTTGGTACC CAGTAACCTG ACAATCAACG ACCCAACACT ACAGGACTTT 
ATTGGTAAAT TTAACGATCT GCTCCTCCAG CGGGAACGTA TGCTGCGTAC CAGCGAAACA 
ACAAACCCAC TGGTCGTACA CATCGATGAG CAGCTGGCCA GCTTCAGACA GTCCATTCTT 
GAAAACTTAA AGACCGTAAA ACGGGGCCTG CTCATTACGC AGGGCGACCT GACAGCCAAA 
ATCAGTAACT TACAGCAGCA CATCACTCAG GTACCCGATA TTGAGCGCCA GCTCAACGCC 
ATAAACCGGC AGGAAGGCGT TAAGCGAAAT CTGTATTCGT TTCTGCTGCA AAAACGGGAA 
GAATCGTCGC TGTCGCTGGC AGCTACCCTT TCAAATACCC GCGTCATTGA TCCAGCAACG 
GCCTCTAAAA CACCCGTTTC ACCCAAAAAA CCCGTTATTT TTGCCCTGGC ATTTGTACTG 
GGGCTGATTT TACCCCTTGC TTTTATTACT GTTCCTGATT TGCTGAGCAA CAAGGTTCGC 
CAGCGCAGCG ATGTATCGAC CGCCGTTGCA GTGCCTATTC TGGGCGAGGT AACGCACTAC 
AGAAAGAAAG GGATTTTCGT TATATCGCAG GAAACCAGGA AGCCAATAAT CGAGCAGCTT 
CGCCTGATAC GAAGCAACCT ACATTTTTCA ACTGCCAACC AGCCGCACCA GGTTATTCTG 
GTAACGTCCA GCGTAGCTAA AGAAGGAAAA ACCTTTTTTA GTATCAATCT GGCTCTAAGC 
CTCTGCTTTC TGAATAAAAA AGTAGCCCTG CTCGATTTAA ACTTCCGGAA CCCACGCCTT 
CTGACCGGTC TGCGGGTGGA GCATGAGGTT GGTCTAACGG ATTACCTGAA CGGTAGCACT 
CCCTCCCTGA ACAGCCTGTT GACACCCTTT CCGGGTACAC CCAATCTGTC GGTTATCGGT 
ACGGGACCTT TGCCCGCCAA TGCGCCTGAG TTTTTGCTGA ATGCAGGTAT AGGCACATTG 
ATCAGCGAGC TGCGGGAACG CTTCGACTAT GTTATTATCG ACTCGGCACC CGTGGGCGAG 
GTGGCCGATA CCTTTGCGCT GGCCGATCAT ATCGACACCA CCATTTTTGT TGTGCGTTTC 
AACTACACCC CTATAGAACG GCTTGAAAGT ATCCGGGAAG CCCATCTGGA AAACAAATTG 
AAACGTCCGC TCATCGTGCT CAACGACGCC CGGAAGGAGA ATAGTTACCG AGTAAAATAG

Protein sequence

MTEGEVSYVS SGESSFRRFL YKYRRFWYLF VISIGASLVL AVLYLKSATP QYNVSISLLI 
KDIEKGPDIR PGNPIFKELD ILNSTTSIED EIEALRSVTL MHRVLTELGL QTSYYVADSF 
KKREIFGADL PIRLSVKTLS QSAYTKPIAI VIKNTQEFQL QDGPPPANTY RFGQLIQRPY 
GTFTVQANPE AMRWQPKKIF IFFNNLEDMA ESYSKATAII QLNKKANVLS VYMQSAVPEK 
GKVILNKLIE VYNKENKEDR NILALNTIKF IEERLRDLTA ELSDIEKATE EFKRRNQVTD 
VRSEANGYLE ESRIYNNQLS ANKIQLDIAE SLERYLARQK QKYELVPSNL TINDPTLQDF 
IGKFNDLLLQ RERMLRTSET TNPLVVHIDE QLASFRQSIL ENLKTVKRGL LITQGDLTAK 
ISNLQQHITQ VPDIERQLNA INRQEGVKRN LYSFLLQKRE ESSLSLAATL SNTRVIDPAT 
ASKTPVSPKK PVIFALAFVL GLILPLAFIT VPDLLSNKVR QRSDVSTAVA VPILGEVTHY 
RKKGIFVISQ ETRKPIIEQL RLIRSNLHFS TANQPHQVIL VTSSVAKEGK TFFSINLALS 
LCFLNKKVAL LDLNFRNPRL LTGLRVEHEV GLTDYLNGST PSLNSLLTPF PGTPNLSVIG 
TGPLPANAPE FLLNAGIGTL ISELRERFDY VIIDSAPVGE VADTFALADH IDTTIFVVRF 
NYTPIERLES IREAHLENKL KRPLIVLNDA RKENSYRVK