Gene Slin_0372 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_0372
Symbol
ID	8724100
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	472560
End bp	473810
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	52%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003385235
Protein GI	284035305
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.862207
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTCAAC AGTCTCCAGT CGATACGTAC GCATCCCTTC GAATTCCCGA ATTTCGCTAT 
TTCGTCATGA ACAGCTTTCT GATTACAGCT ACCCTGCTGA TTCAGGAGGT TATTCTGGGT 
TACGAGCTTT ATAAAATCAC GCACGATCCG CTGATGCTGG GTCTGGTTGG ACTGGCTGAA 
GCGATTCCGT TCATTGCGCT GTCGCTTTTT GGCGGTCACC TGGCCGACCG GCGCGATAAG 
AAGCGGATTC TGCAATGGAG TTTGCTGGTC ATCCTGATTG GGTCGGTTAT TCTGTATCTG 
GTCTTTCAAC CGGCGTTTGC TGCCGGGTTG ACACAAACGG CCCGTTTAGG AACCATCTAT 
GGGGTACTGA TGCTGATTGG CACTGCTAAA GGGTTTTACT CGCCGGCCAG CTCGTCGCTC 
AAGCCATTCT TAGTGCCTCG TGAACTTTAC GCAAATTCGG CCACCTGGAG TAGTTCGTTC 
TGGCAGGCGG GCGCCATTAT AGGGCCGGGT TTGGCGGGTT TTTTATACAG CTGGGTCGGT 
TTCGACAATA CCCTGATTGT GGTTATTGCC CTGCTACTGT TCTGTTTTGT CTTGATTTCG 
CTCATTGAGC GAAAACCAAC ACCCGTTACA GATTCGCCCG TATTGAAACT CAGCGAAAGT 
TTGAAAGAGG GCTTCCGGTT TGTGTTCAAG ACCCAAATTG TTCTCTACGC CATTTCTCTC 
GATCTGTTTT CGGTACTATT TGGGGGGGTA GTGGCTATTC TGCCGGTCTT CGCCGAAGAT 
ATTCTGAAAG TAGGTGCCGA AGGGCTGGGT TTTTTGCGAG CTGCACCGTC GGTAGGAGCC 
TTACTGACAA TGGCCTACAT GACCAAACAC CCACCTACGC ATAATGCGTG GCGCAATATG 
TTGTTGTCGG TAGCCGGGTT CGGCGTGGCT ACGATCATCT TCTCGCTGTC AACCAATTTT 
TACTTATCCC TCATCATGCT CGGCCTGACG GGCGCTTTTG ATAGTGTGAG CGTCATTATC 
CGTCAGACGA TCCTGCAAAT TTTCCCGCCC GATCACATGC GGGGACGGGT GGCTGCAGTA 
AACGGCATCT TTGTCAGTTC ATCGAACGAA ATAGGGGCGT TTGAATCCGG CTTACTGGCC 
CGTTTGCTGG GTACGGTACC ATCGGTTCTG CTGGGTGGCG TTGTTACGCT GCTGGTTGTT 
ACCTACGTGT ACGCCAAATC GAAAGCCCTG CTGGCCGTGC GCTTAAGCTA G

Protein sequence

MVQQSPVDTY ASLRIPEFRY FVMNSFLITA TLLIQEVILG YELYKITHDP LMLGLVGLAE 
AIPFIALSLF GGHLADRRDK KRILQWSLLV ILIGSVILYL VFQPAFAAGL TQTARLGTIY 
GVLMLIGTAK GFYSPASSSL KPFLVPRELY ANSATWSSSF WQAGAIIGPG LAGFLYSWVG 
FDNTLIVVIA LLLFCFVLIS LIERKPTPVT DSPVLKLSES LKEGFRFVFK TQIVLYAISL 
DLFSVLFGGV VAILPVFAED ILKVGAEGLG FLRAAPSVGA LLTMAYMTKH PPTHNAWRNM 
LLSVAGFGVA TIIFSLSTNF YLSLIMLGLT GAFDSVSVII RQTILQIFPP DHMRGRVAAV 
NGIFVSSSNE IGAFESGLLA RLLGTVPSVL LGGVVTLLVV TYVYAKSKAL LAVRLS