Gene Slin_4617 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_4617
Symbol
ID	8728381
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	5609110
End bp	5611488
Gene Length	2379 bp
Protein Length	792 aa
Translation table	11
GC content	53%
IMG OID
Product	protein of unknown function DUF214
Protein accession	YP_003389394
Protein GI	284039464
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.214222
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTAACCA ACTATCTCAA AATCGCCTTT CGCAACCTGA CCCGAAACAA GGCTTTTTCG 
GTCATTAACC TGCTTGGCTT GTCTACGGGC ATTACCGTTT GCCTGATGAT TTTTCTGTTC 
ATCAGCAATG AGTTCAGCGT AGACAATTTC CACAAAAATG GAAAAAGCAT CTACCGCGTG 
ATGCGCGGCA TCGAGAATGA AGGGAAAGAG ATCGGGGTTT CTTACCTGTC TGGGCCGTAT 
GCACCGGCAC TGCTAACCGA TTTTAAAGGG CAAATCACCC AGGCGGTACG GGTAAACCCA 
ACCGATGCGC TGGTAAGCGC TCAGGATAAG TCGTTCCATG AACGAAAAAT CATTGATGTC 
GACCCTAACT TTTTTACCCT CTTCACCTTC CCGTTGTTGA AAGGTGATCC GGCAACCGTA 
TTGACAGAGC CCGCGAGCGT GGTACTCACC GAATCGACGG CCCGGAAATA TTTCGGCAGC 
ATCGACAAGG CGATGGGCCA GATCGTTAAA GTCGACAAAA ACCTACCGCT CAAAGTCACC 
GGTATTGCGC AGGATGTACC CGCCAACTCG CACCTGGATT TCGACCTCGT TATACCGCTG 
GAGAACTATA AAGACCGGAG CTGGATGAAC GTCTGGATCA ACAACGGCAT CTACACCTAT 
GTACAGCTGG CCCCAACGGT TAGCAAAGAA CAGGTTGAGC GAAATTTCCC GCGCTTCATG 
GACAAACACA TGGGACAACT CATGAAGCAG GCGGGCTATC ATTTCAAGCT ATCGCTCACG 
CCATTGCGGG AAATTTACTT TGAACAGGCG GCCTTCGACA GCGTGAAGCA TGGCGACAAA 
AAAGTCGTCT ATATCTTTCT ATCGATTGCC ATCCTCATTC TGCTGGTGGC CTGCATCAAT 
TTCATGAACC TGAGCACGGT GCGGGCAGTG GAGCGCTCGA AAGAGATTGG CGTGCGCAAG 
GTGCTGGGGG CCTTTAAAGC GCATCTGGTG TGGCAGTTCA TTGGCGAGTC GCTGCTGCTT 
ACAACTTTTG CAAGCCTGAT TTCACTGGGG CTGCTGGCCC TGGTCTTTCC CTTTTACAAA 
GAGCTGCTGG GCTACCCCCT GAATCTGGCT GTCTATGCAG GACCGATTGG GCTGTTCCTC 
ATCGCTATTA TCGGGCTGGT GGGTTTCCTT TCGGGAAGTT ATCCTGCCTT TGTGCTGGCG 
GCCTTTTCGC CCATCCAAGC CCTGAAAGGT AAATTACGGA TGGGCAAAGG CGGTACGTCG 
CTGAGGCAGG TACTGGTGGT TGTCCAGTTC AGCATTTCAA TACTGCTCAT GCTCGGAACA 
GCCATCGGTA CCCAGCAAAT GAGTTACCTC AAAAACAAGC AGCTTGGCTA CCATAAAGAG 
CAAACCCTCG TCGTCCCCAT CGACAATGAC GACATCTATA TGTTCTTCCT GAGGCACAAA 
CAGGAACTGC TGGCGCAGAG CCGGGTAGAG GCCGTGTCGA TGATGTCGGG CGAGCCGGGT 
GGCTTTTTCG ATGGGCAAAT GTTCGACGTC GAAGCGCACG CCAACCGATG GAAATCCCGG 
AGCGAGTTTG CCGATTTCGA TTACGTAAAA ACATTAGGAT TGAAAATCAT TGCTGGTAGG 
GATTTTTCGG GCCAGTACCC TTCCGACACC ACCCGGTCGG CCCTGATCAA TCGGACGGCA 
GCGGCCCGGC TGGGCTGGAA ACCCGAAGAA GCCATCGGTA AGTGGATAAA GAATACATTG 
CGGGACAGCA CGAACCGCAC GATCATTGGT GTCGTTGAAG ATTTCAATTT CCTTTCCCTT 
AAAGAAGGGA TTGAACCCCT GGTGATTTCC CCCGCCGACG ACCGGCGGGC GGCCCTGATC 
AGACTTAGCC CCGGCAACCT GTCGGCCACG GTCGAAACCA TCCAGCGACT ATACGCCCAG 
ACGCGCCCGG CCTATCCGTT TGAGTACCAC TTCCTGGACC AGAAGTTCGA CCAGATGTAC 
CAGGCCGACC TGCGTCAGCA GACAATTATG CGTGTTTTTG CCGGCTTAGC CATTTTCATC 
GCCTGTCTGG GCTTGTTTGG TCTGGCTTCT TTTTCGGCCC AGCAGCGTAC CAAAGAAATT 
GGCGTCCGGA AAGTGTTAGG GGCTTCGGTG GGCAGTATTG TCAACCTGCT TTCCGGCGAT 
TTCCTGAAAC CAGTGGGCAT TGCTATTCTC ATTGCCAGCC CGATTGCGTG GTACATTATG 
AATGAATGGC TGCAAAACTT TGCGTACCGG ATTGACCTGT CGTGGTGGGT CTTTGCCCTG 
GTCGGGTTGC TGGCGGTGGC TATCGCGCTC CTGACGGTCA GTTTCCAGAG TATCAAAGCG 
GCATTGATGA ACCCGGTGAA ATCGTTGCGG TCGGAATGA

Protein sequence

MLTNYLKIAF RNLTRNKAFS VINLLGLSTG ITVCLMIFLF ISNEFSVDNF HKNGKSIYRV 
MRGIENEGKE IGVSYLSGPY APALLTDFKG QITQAVRVNP TDALVSAQDK SFHERKIIDV 
DPNFFTLFTF PLLKGDPATV LTEPASVVLT ESTARKYFGS IDKAMGQIVK VDKNLPLKVT 
GIAQDVPANS HLDFDLVIPL ENYKDRSWMN VWINNGIYTY VQLAPTVSKE QVERNFPRFM 
DKHMGQLMKQ AGYHFKLSLT PLREIYFEQA AFDSVKHGDK KVVYIFLSIA ILILLVACIN 
FMNLSTVRAV ERSKEIGVRK VLGAFKAHLV WQFIGESLLL TTFASLISLG LLALVFPFYK 
ELLGYPLNLA VYAGPIGLFL IAIIGLVGFL SGSYPAFVLA AFSPIQALKG KLRMGKGGTS 
LRQVLVVVQF SISILLMLGT AIGTQQMSYL KNKQLGYHKE QTLVVPIDND DIYMFFLRHK 
QELLAQSRVE AVSMMSGEPG GFFDGQMFDV EAHANRWKSR SEFADFDYVK TLGLKIIAGR 
DFSGQYPSDT TRSALINRTA AARLGWKPEE AIGKWIKNTL RDSTNRTIIG VVEDFNFLSL 
KEGIEPLVIS PADDRRAALI RLSPGNLSAT VETIQRLYAQ TRPAYPFEYH FLDQKFDQMY 
QADLRQQTIM RVFAGLAIFI ACLGLFGLAS FSAQQRTKEI GVRKVLGASV GSIVNLLSGD 
FLKPVGIAIL IASPIAWYIM NEWLQNFAYR IDLSWWVFAL VGLLAVAIAL LTVSFQSIKA 
ALMNPVKSLR SE