Gene Slin_5223 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_5223
Symbol
ID	8728989
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	-
Start bp	6374824
End bp	6376068
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	52%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003389994
Protein GI	284040064
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAAAA ACAGACAGTT ACTGCTTATT TTTTCCATTG TTCTGATCGA TGTTATTGCA 
GGTAGTGGAT TGGGCGTGCT GATTTCAAAC TATGTATTGA ACTTGCCGGC TAAGCCTGTG 
CTTATGACGG TTGGCACCGC CCTCATGCTG GGCGTTCAAC TGGCGGGTTC CCCGGCCATT 
GGTCGCTGGT CTGATTTGCG GGGCCGTCGA CCGGCAGCCA TTGCTACCAC GGTGGTATCG 
CTGCTCTCAT CCCTGTTCTT ACTACCCGTT CAAACCTGGG GATACGTTGC CAGCCGGTGG 
GTGAAGGGTG GGTCTAATGG GCTGTACTCT GTTATGCGGT CGGCGGTGGC TGACCTGACC 
GATAAAGATG AACTGCTTAA ATATGGCGGA CTGTTTAGTT TCATTGCCGG TTCGGCACCG 
GTTATTGGCC CTATGGGTGC CGGGTGGCTC ATGCTGGTAG TTCACGAAGC CCGGATCAAT 
CCATTACCTA CGGTTCTGCT CCTGTTGGCA CTAGGTTTGC TGAACATCAG ACTAGCAATG 
CTTTTCCGGG AAACCAATCC TAAAAAAGAA GCTGTTGACT ACACCGAACT GGCCGATAAA 
GCGCGTAACT CGCTGAAAGT CGTTTCTATC TGGCGGCAAC TCCTTGAGGC CGATAAACAG 
CTTCCGGGTA TAAAATCTAT TCTGATTCTA AACTTGCTGG CTACCCTCGG TATGGGGTAT 
TTCGCTTTTT TTGTGGCCTT CCTGACCCAG AGTGAGCTTA TTATGACGCC CGCCGAAACA 
GCCCGGTTTT TCCTGTACTA CGGTGGTCTG GCGTTAGCCG CCAACTTTAT TTTCTTTACC 
TACATCGTTC AGCACGTCAA TAAGCGCATC GCGATTCTGG TTATGGCGTT GATCAGCATT 
GTTTTGCAGG TAGTGTATAC CTTTTCAGAA TCGTCGGTCG AGCTGTTTTA TGTAGTGGCC 
GGTGTCGACG CGCTCACCGT TTCCATTATT ACCGGCCTAA CCGGGGGCAT CCTATCGCAG 
GTGATCAAGG AAGGCAGCGG ACAGGGCGAA ATGTTCGGTA ATATACAGGC GCTGGGCGGG 
CTGGCCAGTT TTGCAACGGC ATTGGTAAAC AGTCTGCTCT CGGGAGTAAG CCTGAAAGCC 
CCGTTTATTT TCTGTGCTAT CAGCATGATT GCCGTCGTTA TCTGGACAAT ACGCCTGCCG 
AAAGCAGCCA GGCAACATAC CGACTCGAAA ACGCCTGCGA CCTGA

Protein sequence

MSKNRQLLLI FSIVLIDVIA GSGLGVLISN YVLNLPAKPV LMTVGTALML GVQLAGSPAI 
GRWSDLRGRR PAAIATTVVS LLSSLFLLPV QTWGYVASRW VKGGSNGLYS VMRSAVADLT 
DKDELLKYGG LFSFIAGSAP VIGPMGAGWL MLVVHEARIN PLPTVLLLLA LGLLNIRLAM 
LFRETNPKKE AVDYTELADK ARNSLKVVSI WRQLLEADKQ LPGIKSILIL NLLATLGMGY 
FAFFVAFLTQ SELIMTPAET ARFFLYYGGL ALAANFIFFT YIVQHVNKRI AILVMALISI 
VLQVVYTFSE SSVELFYVVA GVDALTVSII TGLTGGILSQ VIKEGSGQGE MFGNIQALGG 
LASFATALVN SLLSGVSLKA PFIFCAISMI AVVIWTIRLP KAARQHTDSK TPAT