Gene Slin_4085 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_4085
Symbol
ID	8727844
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	4917197
End bp	4918672
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	55%
IMG OID
Product	protein of unknown function DUF1501
Protein accession	YP_003388871
Protein GI	284038941
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0673014
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.397538
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAAGT TACTGAACGA ACTACTTCAT GCCGATGTGC AGCGGCAAAC CCGGCGCCAC 
TTCCTGCAAT CCGCCGGTTT TGGGTTGGGC GTGCTGGGGC TGGGCTCACT GCTAAATGCG 
TGCGGTCAAT CCAGCGAGGG AAAAACGGAT ACCCGTCCGG CCGCACCCTT AAACGTGCCG 
CATTTTGTGC CCAAAGCCAA ACGGGTCATT TATATCCACA TGGCGGGGGC CCCTTCCCAA 
CTGGAACTGT TCGATTACAA ACCCGAACTG GAAAAATACC ACGGTAAAGA CTGCCCGGCG 
GCTTTTCTGG AAGGGAAACA GTTTGCCTTT ATTCAGGGAG TTCCCAAGAT GCTGGGGCCA 
CAGGGGAAGT TTGGCCAGTA CGGTCAGTCG GGAGCCTGGC TATCGGACTA CCTTCCTTAC 
CTGCAAACGA TGGCCGACGA GATCACCTTT CTGAAAGCCA TGCATACCGA CCAGTTCAAC 
CACGCACCGG CCCAATTGCT GCTTCATACG GGAAGCGCCC GGCTTGGACG CCCGAGCCTG 
GGCGCGTGGG CCGTGTATGG ACTGGGCTCC GATAATCATA ATCTGCCCGG TTTTATCGTT 
CTGGCGTCGG GCGGTCGGCA ACCCGACGCG GGAAAAAGTG TGTACGGCAG TGGGTTTCTG 
CCATCCGTTT ACCAGGGGGT GCAATGCCGC ACCGGTGGCG ATCCGGTACT CTACGTAACT 
GATCCTAAGG GCATAAATCG CAACATGCGC CGGAAAACCA TCGAGGCTAT CAACGAAATC 
AACCGTCAAA CCTACGAAGA CGCCCAGGAC CCGGAAACGC TGACCCGCAT AAGCCAGTAT 
GAAATGGCTT TCCGCATGCA AATGTCCGTT CCGCAGGTGA TGGACGTATC GAAAGAGCCA 
CCGTTTATCC TGGATATGTA TGGGGTAAAA CCCGGCGAAG GCAGCTTTGC GATGAATTGC 
CTGCTGGCCC GTAAGCTGGT TGAGAATGAT GTCCGGTTCG TACAGCTTTT CGACTGGGGC 
TGGGATGGTC ACGGCACGTC GGCTTCGGAC AATATAGAAG GTGGGTTACG GCAAAAATGC 
AGGCTTTCGG ATAAGCCCGT AGCAGCCTTG CTGCAAGACC TCAAGATGCG GGGACTGCTT 
GAAGAAACGC TGGTGGTATG GGGTGCCGAG TTTGGCCGAA CCCCCATGCA GGAAAACCGA 
AATGGCCTGG TGATGCCTTA CATGGGACGG GACCACCATC TGGAAGCGTT CACCATGTGG 
ATGGCCGGAG GCGGCACCAA ACAAGGCTAC ACGCATGGGC AGACCGATGA GCTGGGCTAC 
TATGGCGTGA ACGACCGGGT GCATGTCCAC GATCTACAAG CCACTATTCT TCACTTGATG 
GGTTTCGATC ACGAGAAATT CACCTACCCT TTCCAGGGCC GGAACTTCCG TCTTACAGAT 
ACAGCCGGTA AAGTTGTCAA TGAAATACTA GCCTGA

Protein sequence

MNKLLNELLH ADVQRQTRRH FLQSAGFGLG VLGLGSLLNA CGQSSEGKTD TRPAAPLNVP 
HFVPKAKRVI YIHMAGAPSQ LELFDYKPEL EKYHGKDCPA AFLEGKQFAF IQGVPKMLGP 
QGKFGQYGQS GAWLSDYLPY LQTMADEITF LKAMHTDQFN HAPAQLLLHT GSARLGRPSL 
GAWAVYGLGS DNHNLPGFIV LASGGRQPDA GKSVYGSGFL PSVYQGVQCR TGGDPVLYVT 
DPKGINRNMR RKTIEAINEI NRQTYEDAQD PETLTRISQY EMAFRMQMSV PQVMDVSKEP 
PFILDMYGVK PGEGSFAMNC LLARKLVEND VRFVQLFDWG WDGHGTSASD NIEGGLRQKC 
RLSDKPVAAL LQDLKMRGLL EETLVVWGAE FGRTPMQENR NGLVMPYMGR DHHLEAFTMW 
MAGGGTKQGY THGQTDELGY YGVNDRVHVH DLQATILHLM GFDHEKFTYP FQGRNFRLTD 
TAGKVVNEIL A