Gene Slin_5026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_5026
Symbol
ID	8728791
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	6126394
End bp	6128022
Gene Length	1629 bp
Protein Length	542 aa
Translation table	11
GC content	52%
IMG OID
Product	sulphate transporter
Protein accession	YP_003389802
Protein GI	284039872
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0023678
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAACAC AAGTTAAACC TATTATTCAC GTCGTTCCGG CGAAAGGTCT TGCCGGGTTG 
AAAGAAAATT GGCAGTCCGA TTTATTATCC GGATTCCTGG TTTCGCTGAT TGCCTTGCCA 
CTCAGCCTTG GTATCGCATC AGCCAGTAAT TTTCCGCCAA TCATGGGCGT GCTGACAGCC 
ATTGTTGGCG GGTTGATCGT TGCGTTGTTT GCGGGTTCGG AACCAACCAT TAAAGGGCCG 
GCGGCCGGGT TGATCGTAAT TGTTGCCGGT TGCGTAGAAG AATTAGGAAA GGGAGACCTC 
GAACTAGGCT GGAAACTGAC CCTGGGGGTT ATCATAGCGG CCGGTGTCCT GCAAGTGGTT 
ATGGGCATAC TGAAAGTGGC CAAACTAGCC GACTTTTTTC CGCTGTCGGC CGTCCATGGT 
ATGCTGGCAG CCATCGGGAT CATCATCATG TCGAAGCAGA TTCACCTGGC CGTTGGTATC 
GCCCCATCCG AACTAAAGGG AAAAGAGCCG CTCGAACTGC TGGCAATGGT GCCCCACAGT 
CTCAGCCATA TGGAGTGGCA CGTAGCAGTG ATCGGGCTCG TTAGCCTGGT TATTCTGTTT 
AGCTGGCCTA ACATCAAAAG CAAAGCGATC AAGCAAATCC CTCCCGCACT GGTTGTTCTG 
GTCGTAGCCA TTGCCCTGGG ATTATACTTC AACCTGTCTG ATACAAAACT ATACAGCGCC 
ATTAAACCAC TGGTCAATCC CGGCGAGTTT AAGCTGTCGT ACAATGCAAA CTTTGGAGCC 
TGGTCGGGCG ACATGCTGCC CGTCGCCCTG AAATACCTCG CCATGTTCAC TATTATTGGC 
TCGCTGGAGT CGCTGCTGAC GGGTAAGGCA ATCGACCTGC TTGACCCCTA CAAGCGTAAA 
TCGAATTTAA GCAAGGATTT AACAGCGGTT GGTATCGGCA ACATGGTGTC GGCAGCACTG 
GGTGGCCTAC CTATGATTTC GGAAGTAGCC CGTTCGTCGG CTAACCTGAC CAATGGGGGC 
AAAACTCGCT GGGCAAACTT CTTTCACGGC GGATTCCTGC TGCTTTTTGT AGTGGCTCTT 
GTTCCGCTCA TCAAACTTGT TCCGGTAGCG GCACTGGCGG CCATCCTGAT TGCCGTTGGG 
TTCCGGTTGG CTGCTCCCAA AGAGTTTCGC CATATGCACC ACATAGGAGC TGAGCAGTTG 
ATCGTATTTG TGATTACAAT TATAGCTACG CTGGCTACCG ACTTGCTGGT AGGCATTGCG 
GTGGGTATTG CCGCCAAGTT TGTTATCCAG CTGGCACTCG GCCTGCCTAT AAAATACCTT 
TTCAACCCCC AGCAGGAGCT TATCTCCGAA GGATCGCACC ATACACTTAC CATCACCGGA 
GCCGCTGTGT TTACCAATTA CCTGTCGATC AAAAAGCAAC TGGACACTAT CCCACAGGAG 
GCAGGTCAGC ACGTCACAGT CGACTTACAC CAGGCCCGGT TCGTAGACCA TACCGTTATG 
GAAAATCTGC ACAATTACGA GCGTGATTTT CAACTGGCCG GTGGCGAATT CCACGTCATT 
AACCTCGATG GGCACCAACC CATGTCGACG CATCCGCTGG CGGCCCGTCG AAAAAAAATG 
GCCATTTAA

Protein sequence

METQVKPIIH VVPAKGLAGL KENWQSDLLS GFLVSLIALP LSLGIASASN FPPIMGVLTA 
IVGGLIVALF AGSEPTIKGP AAGLIVIVAG CVEELGKGDL ELGWKLTLGV IIAAGVLQVV 
MGILKVAKLA DFFPLSAVHG MLAAIGIIIM SKQIHLAVGI APSELKGKEP LELLAMVPHS 
LSHMEWHVAV IGLVSLVILF SWPNIKSKAI KQIPPALVVL VVAIALGLYF NLSDTKLYSA 
IKPLVNPGEF KLSYNANFGA WSGDMLPVAL KYLAMFTIIG SLESLLTGKA IDLLDPYKRK 
SNLSKDLTAV GIGNMVSAAL GGLPMISEVA RSSANLTNGG KTRWANFFHG GFLLLFVVAL 
VPLIKLVPVA ALAAILIAVG FRLAAPKEFR HMHHIGAEQL IVFVITIIAT LATDLLVGIA 
VGIAAKFVIQ LALGLPIKYL FNPQQELISE GSHHTLTITG AAVFTNYLSI KKQLDTIPQE 
AGQHVTVDLH QARFVDHTVM ENLHNYERDF QLAGGEFHVI NLDGHQPMST HPLAARRKKM 
AI