Gene Slin_0520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_0520
Symbol
ID	8724248
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	640953
End bp	642167
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	50%
IMG OID
Product	nucleoside:H symporter
Protein accession	YP_003385383
Protein GI	284035453
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000056918
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGTCAA CGACCCGCGT CAAACTTTCC GTCATGATGT TTCTCCAGTT TTTTGTTTGG 
GGAGCCTGGT ACGGTCAGAT GAGTAAATAC CTGCTTACAC AACTTCATTC AACGGGCGAT 
CAGGTCGGTA ATGCCTATGC GGCTTTCTCG CTGGCCATGA TCATCGCTCC CTTTTTCGTC 
GGTATGATTG CCGACCGTTA TTTTGCCGCT CAAAAGGTGC TGGGTGTTCT TAATCTGCTG 
GGTGCGGTCG TTTTGTACTT CATCACCCAA AATACTGACC CTGATAATTT TTTCTACCTC 
ATTCTGGCGT ATTGCCTGAC GTTTGCGCCA ACGCTGGCCC TCACTGCCTC TATTGCGATG 
CAGCAGATGA GTGTCCCCGA AAAAGAGTTT CCGGGCATTC GGGTGCTGGG TACGGTGGCG 
TGGATTATCG TGACAAACAT CGTTGGTTAT TATGGTTTTG GCGATAAGGT GACCATCTTC 
CAGCTATCCA TGTATTCGGC GGTTGTTTTG GGTATTTTTG CCTTCTTTCT ACCCAACACA 
CCTCCCAAAG CGACGACATC TACGTCGTTC TCCCAGATTC TTGGACTGGA TGCGTTTAAA 
CTGTTTAAAG ACCGGTCGTT TGCAATCTTC TTCCTGTCAT CGGTATTGAT CTGCATCCCG 
CTTTCGTTCT ACTACGCTAT GGCTAACCCC TCGCTGACCG ATGGCGGTAT GCAGAATGTA 
GAGAATAAAA TGTCGCTGGG GCAGGCGTCT GAAGTGATTT TCATGCTGCT GATTCCCCTG 
GCCTATACGC GGCTTGGTGT TAAGAAAATG CTGATAGTAG GGCTGGTAGC CTGGATTGTC 
CGGTTTATCT GCTTCGGCTA TGGCGACGGC GGCTCCGGCG AATGGATGCT CTATCTGGCT 
ATCGTACTGC ACGGCGTTTG CTATGATTTC TTCTTCGTAA CGGGCCAGAT TTATACGGAC 
AACAAGGCGG GCGAGAAAAT CAAATCGTCG GCGCAGGGGC TCATCTCCCT CGCTACCTAT 
GGTATCGGGA TGGGTATTGG TTCCAAACTG TCGGGTATCG TGCTCGACAT GTATACCCGC 
CCCGATGGCA CTAAAGACTG GCTAGCTGTG TGGCTCGTTC CGGCCGCTAT TGCCGCTGCG 
GTATTGATCA TCTTTGTGCT GCTGTTTTCG GATAAGAAGA AAGCCGTTCC TAATGAGGGT 
CAACTGGTAT CGTAA

Protein sequence

MLSTTRVKLS VMMFLQFFVW GAWYGQMSKY LLTQLHSTGD QVGNAYAAFS LAMIIAPFFV 
GMIADRYFAA QKVLGVLNLL GAVVLYFITQ NTDPDNFFYL ILAYCLTFAP TLALTASIAM 
QQMSVPEKEF PGIRVLGTVA WIIVTNIVGY YGFGDKVTIF QLSMYSAVVL GIFAFFLPNT 
PPKATTSTSF SQILGLDAFK LFKDRSFAIF FLSSVLICIP LSFYYAMANP SLTDGGMQNV 
ENKMSLGQAS EVIFMLLIPL AYTRLGVKKM LIVGLVAWIV RFICFGYGDG GSGEWMLYLA 
IVLHGVCYDF FFVTGQIYTD NKAGEKIKSS AQGLISLATY GIGMGIGSKL SGIVLDMYTR 
PDGTKDWLAV WLVPAAIAAA VLIIFVLLFS DKKKAVPNEG QLVS