Gene Slin_3687 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_3687
Symbol
ID	8727440
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	4445032
End bp	4446273
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	48%
IMG OID
Product	glucose/galactose transporter
Protein accession	YP_003388491
Protein GI	284038561
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.202302
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.04252
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTTCCT CCTCCCCTAA AGTTCAGAGT TACATGGGCC CACTGCTCAT CATTGCGGTC 
CTGTTTTCGG TCTTCGGTTT TCTCACTTGG GTCAATAGTG TGCTGATTGC ATTCTTCAAA 
CAGGTCTTTG ATCTAAGTAC CGTCGCTTCA AACTTAGTAG CCTTTGCTTT TCTGATCTCC 
TATACCGTTA TGGCTATTCC AGCCTCTATG TTCTTAAACC GGACGGGCTT TAAAAACGGG 
ATGTCACTCG GCCTCTTAGT GATGGCGACC GGAACATTGG TTTTCGTTCC AGCCGTCCGG 
ATGGTATCCT ATCCACTGTT TCTAGTGGGT TTATTCGTGA CGGGCATTGG TATGACAGTG 
CTCCAAACGG CAGCCAATCC TTACGCCACT ATTTTGGGGC CGCGCGAGAG TGCAGCACAA 
CGGATAAGTT TCTTGGGTAT CGCCAACAAG CTAGCCGGTA TTGCTAGTCA GTATATCTTT 
GGCGGACTAC TGCTAACCGG AGCCAATACG GTAGCTAGTG CGGCTTCGCT GGAAAAAATT 
ATAGCACCCT ATCTGATCTT GACCGCACTT CTAGTCGTCT TAGCGGGTTT AATCCGCTTT 
TCCAGCTTAC CCGAATTATC AGAAGAACAA GATAATCCCT CATCGAGTCC AGCGGCTGCT 
TCCCAACCGG TTAGCGCAGT CCAAACCCGT ATATGGCAAT TCCCTAATTT GATCCTAGGG 
GTAGTCACCC TGTTCTGTTA TGTGGGGGCG GAGGTGATTG CCGGTGACAC GATCATCAAC 
TATGGCCGAG CATTAGGCTT CAACAATGAT GAAGCCAAGT ATTTTACCAC CTATACGCTG 
TATGGATTAC TAGCGGGCTA TTTACTAGGA ATTGTTTTAA TTCCTCGTTT TATCTCCCAA 
CAAACGGCCT TACGCTTTGG GGCTATTTAT AGTCTGTTGC TGACGGTGGC CACTTTACTG 
AGCAGCGGCT TTACGTCCGT ATTATGCGTA GCCTTGCTGG GCTTTGGCTT AGCTCCTATT 
TGGCCTGCCA TCTGGCCCTT GGCTTTGAAT GGGTTGGGGC GTTTTACGAA GACCGGCTCT 
GCCCTGTTGA TTATGGGAAT TTCTGGAGGA GCCTTATTAC CCTTGTTACA CGGTTATATC 
ACCGATACGG TCAGTCCTAA AATGGCTTAT GCTTTGTTGC TCCCCCTCTT CAGTTTCATC 
TTATACTATG CAATTTGGGG CCATAAAAAG ACAAGTTGGT GA

Protein sequence

MVSSSPKVQS YMGPLLIIAV LFSVFGFLTW VNSVLIAFFK QVFDLSTVAS NLVAFAFLIS 
YTVMAIPASM FLNRTGFKNG MSLGLLVMAT GTLVFVPAVR MVSYPLFLVG LFVTGIGMTV 
LQTAANPYAT ILGPRESAAQ RISFLGIANK LAGIASQYIF GGLLLTGANT VASAASLEKI 
IAPYLILTAL LVVLAGLIRF SSLPELSEEQ DNPSSSPAAA SQPVSAVQTR IWQFPNLILG 
VVTLFCYVGA EVIAGDTIIN YGRALGFNND EAKYFTTYTL YGLLAGYLLG IVLIPRFISQ 
QTALRFGAIY SLLLTVATLL SSGFTSVLCV ALLGFGLAPI WPAIWPLALN GLGRFTKTGS 
ALLIMGISGG ALLPLLHGYI TDTVSPKMAY ALLLPLFSFI LYYAIWGHKK TSW