Gene Slin_2066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_2066
Symbol
ID	8725804
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	2495667
End bp	2496881
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	53%
IMG OID
Product	protein of unknown function DUF418
Protein accession	YP_003386906
Protein GI	284036976
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0837783
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTATGC ACGCTCCACA AGTCCACCCC ACCACGGAGC GCAGCGCACT GGTTGATGCG 
CTTCGTGGGC TGGCCCTGCT GAGTATTGCC CTGGCCAACG TGCCCACGGG CGATGCGCTT 
AAAAGCACCC ATTACATCTT CCTAAATAGC CAGGCCATCA ACCCGATTCT GGAAGCGGCT 
AAGCACATCC TGATCAGCAC GAAGTTCATT ACCCTCTTTT CCATTCTGTT TGGCTACGGT 
TTCTATACCC AGCTAAACCG GGCCACGCAG TGGGGTACTT CTTTCAGGCG CTACTTTACG 
ATGCGTATGC TACTGCTGCT GATCATTGGG TGTCTGCATG CTTACCTGCT CTGGTTCGGC 
GACATTATCC GGTACTACGC CCTCTGCGGC ATGGCGCTGC TCGTCTTTCA TCAGCTTTCC 
ACCCGAAAAC TGCTCATTAC GGCCCTGGTC TTCATGGTTC CGGTCACGGC CATCCTGTTC 
ATTCTGAACG GCCTGCTGGA ACTACAACGC TACAGCTACG ATTACACCAT TCCCGACCGG 
ATCATCTATG AGACATCTTA CTTAAACTAC CTGCGCGACA ACTTCACCAT TGATCCAATG 
GTCAATTTTG TCCAGGATTC GCCCATCACG TTTGCGGCCT GTTTCGGAAA AATCCTGTTT 
GGTTACTGGC TGGGTCGAAT TAGCTTTTTT CAGCAACCCC AACGGTTCGG GCGCATGCTG 
AAGAAGTGGT TCTGGTGGGG ACTTTCGGTG GGAACTTTTG CCAGCGTGGG CTACTGGGCA 
GTTAGTACGG GGCGGCTAAC GTTAGACCTT CCACTACTGT GGTTGCCTTT TGTCATTGCG 
GGCGGGCTGG TGCTCCACAG CCTGTTCTAT ATCGCAGCCT TTGTGAGGGT ATTTCAAACC 
CAGCGAGGTA AGCGGGTTTT GCTGATTTTC GCTCCCCTCG GAAAAATGGC CCTGACCAAC 
TACCTGCTTC AGACGGTCTT TTATCTGCTC TTTTTTTACG CCTGGCCCCA CGCCTGGCCA 
ACAAGCCAAC GAATCAGTCT GGCCGAGGTG TATCTGCTCA CGTTGCTCTT TTATGGATTG 
CAGGTACTCT TCAGCCACTG GTGGCTACGG TATTTCAGTC AGGGGCCGGT GGAATTCCTT 
TGGAAAAAGA TGGCTTATCG GCAGCTTGGG CCGGGTGACC GCCCGGCATC GCAAATCTCT 
TCGATTCCGT CCTGA

Protein sequence

MTMHAPQVHP TTERSALVDA LRGLALLSIA LANVPTGDAL KSTHYIFLNS QAINPILEAA 
KHILISTKFI TLFSILFGYG FYTQLNRATQ WGTSFRRYFT MRMLLLLIIG CLHAYLLWFG 
DIIRYYALCG MALLVFHQLS TRKLLITALV FMVPVTAILF ILNGLLELQR YSYDYTIPDR 
IIYETSYLNY LRDNFTIDPM VNFVQDSPIT FAACFGKILF GYWLGRISFF QQPQRFGRML 
KKWFWWGLSV GTFASVGYWA VSTGRLTLDL PLLWLPFVIA GGLVLHSLFY IAAFVRVFQT 
QRGKRVLLIF APLGKMALTN YLLQTVFYLL FFYAWPHAWP TSQRISLAEV YLLTLLFYGL 
QVLFSHWWLR YFSQGPVEFL WKKMAYRQLG PGDRPASQIS SIPS