Gene Slin_4090 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_4090
Symbol
ID	8727849
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	4924629
End bp	4926104
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	45%
IMG OID
Product	polysaccharide biosynthesis protein
Protein accession	YP_003388876
Protein GI	284038946
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.291597
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.0803273
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAGGCA AGAAGATAGG ACAGAACTTT TTCATTAGTA TCATATCAAT GGGCCTGGGT 
ATCCTGAGCT CTGTATTTAT TGCCCGTATT GGCGGACCAA CCATCATGGG CAATATCGGG 
CTGGCCATGT CTTTCCAAGT TTTGGTGAAG TCGATATTTA CGCATACCGT TAACAGCGTT 
CATTTGAAAA TGTACAATGA AAACAACCAG ATAGGGCTCA AGAACTACAT GGTTGTTTTT 
GTGTTGTATA ATGTCCTCAC ATCGTTATTG GTTTTATCCT TTGTTCTCTG GAATCACTTT 
AGTCACAACG GCACCTTTAC CGATCTTCAG ATCTCACTGA TTGTCATTTT TATCCTCCAG 
GATTACTTAA TGACGCCCTT TTATATTTAC ATAACGGATC AATCGTCGAA ACTCAATATT 
ATCAGGTCCA ACATGACTGA TTTTTATGCT CAGACGCTGA TCAATATTGC CAAAATTGCC 
GCCGTTCTGC TGGGAGAATC GGAAATTGGG ATTGCCTGGT ACATTATGGC AGCTTGCGCG 
TTAAGCTCTG TTTATCCACT GATCAATTTG ATCCGGTCGG ACTTTGGCAC CTACTCCCTG 
GCGGTTGTAA AGAAGTACAT CCGTTACTCC ATGACGATTT CCACATCTAC GATTGCCTAC 
GGATTATTGG TCAGCTTCGA CAAAGTACTA CTGGGGCTTT ACCAGGTTTC GCCGGAGCAA 
ATTGGCTTTT ATAACGTGGG AAACCGACTC GGGCTGCTGC TCATGACCTT AGGCATTAGC 
ATTGGCAGTA TTCTGTTATC GGTTTTCTCT AAGAACGCAA CGGACAACAA CAACGACAAA 
ACGATCAGCC AGTTAAGCAG CTATGAACGA TTCATCACCA TCAGCTTCTT ACCGGCGGTT 
CTGGCCGCTT CGCTGTTCGG CAACGAGTTG ATCACACTGG TTTTTGGCGC CCGCTACCTC 
GAAGCATTCC CGGTGCTGAT TCTGTCGATT CTGTTCGCTT ATGTCAAAAT ATTGACCATT 
CCCTACCAGA ACTACTTATT TGCCAATAAC AGCTTCAGGG CGTTTAACCG CAATTCGATC 
CTATTCATTG TGGCTATTGT CTTTTTCTCA ACTACAATGG CCTATTTCAA TTTCTTCAAT 
GATCTGCCGA TTTCCGTTGC CGTTGCCCTG TTGCTGGCCT GTCTGCTTGA GCGTGTGCTG 
TTCACCCGCG ATGCCGCCAA AATAGACCCC CAGATTCGGC TGTTCTTCCA TCCAGGAATG 
ATGCTTTTCT TCACCGGCAT CACCGTGGGC TGGTTTGTTC TGGATGAATT CATACCCGCT 
ACCAACTACC TGCTGAGCTA TGGAATTCGT GTGGTGATTT TGCTCGGTCT ACTACCAGTC 
GGCTACCTTT TGGGAATATA CACCAAAGAT GACTTCTACA TGATTACTGA TCTATTGAAC 
ATACCGACTG GCAGGAAAGC AGTCTCACAG GCGTAA

Protein sequence

MLGKKIGQNF FISIISMGLG ILSSVFIARI GGPTIMGNIG LAMSFQVLVK SIFTHTVNSV 
HLKMYNENNQ IGLKNYMVVF VLYNVLTSLL VLSFVLWNHF SHNGTFTDLQ ISLIVIFILQ 
DYLMTPFYIY ITDQSSKLNI IRSNMTDFYA QTLINIAKIA AVLLGESEIG IAWYIMAACA 
LSSVYPLINL IRSDFGTYSL AVVKKYIRYS MTISTSTIAY GLLVSFDKVL LGLYQVSPEQ 
IGFYNVGNRL GLLLMTLGIS IGSILLSVFS KNATDNNNDK TISQLSSYER FITISFLPAV 
LAASLFGNEL ITLVFGARYL EAFPVLILSI LFAYVKILTI PYQNYLFANN SFRAFNRNSI 
LFIVAIVFFS TTMAYFNFFN DLPISVAVAL LLACLLERVL FTRDAAKIDP QIRLFFHPGM 
MLFFTGITVG WFVLDEFIPA TNYLLSYGIR VVILLGLLPV GYLLGIYTKD DFYMITDLLN 
IPTGRKAVSQ A