Gene Slin_2049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_2049
Symbol
ID	8725787
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	-
Start bp	2479518
End bp	2480885
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	52%
IMG OID
Product	hypothetical protein
Protein accession	YP_003386893
Protein GI	284036963
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.717116
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTGT CTTATTCGTT CACGCTTACA AGCCTTGGAC TGCTCTTGTC AGGAGCGGCC 
TGGTCGCAGT CGACGGCTCC TCAGTTGTCG ACTGTCGCTA CGCCCGTAAC AACGCTGAAC 
TCCATACCAC CCTCAAATGC CGGACAAGCA GTTGGTACCA ACAAACCCGC CGAAACGTCG 
GCAGTCACCC TAAAATTTAC CGGTTTTGTG CGAAACGATT TTTCGTTTGA TTCCCGCCAG 
ACGGTCAACC TGCGTGAAGC TTCGGTGGAC TTATACCCAC GGGATAAGCA AGTTGACGTG 
AATGGAGTGG ATGTGAATGC GGTCACAAAC TTTAACATGC TGGCCATCAA TAGTCGGCTG 
GGTGCGGTGT TTACCGGCCC CGATGCGTTT GGTGCTAAAA CCTCGGGATT ATTGGAAATG 
GAATGGTTTG GCCCCTCAGA TGCTGCCGTG GGCGGTGTTC GGTTGCGGCA CGCCTGGGCC 
AAACTAGACT GGCCGAAACG ACAGTTGGCG TTTGGCCAGT TCTGGCACCC ATTGTTTGTG 
CCTGAAGTAT TTCCTGGAGT GGTCAACTTT AATACGGGCA TTCCTTTTCA GCCATTTAAC 
CGAAGCCCGC AGATTCGCCT TACCGAATAT CTAAGCAAAG ATGTCAGCCT TATTCTGGCC 
TTGATTGCCC AACGCGATTT TACCAGCATC GGCATAAGCG GGAGCTCGTC TGAGTATATA 
CGGAATACGG CGGTGCCTAA TTTACATGCC CAGTTGCAGG TAAAGAAAGG TCGGGTGGTG 
GCTGGTCTGG CATTCGATTA CAAAATGATT CGGCCACGAC TTTCGACCGG CAGTGGTACG 
TCTTTACTGG TTAGCAAGGC TACAGTGGGT AGTTCGGCTG TTATGGCGTA TTTGAAAGTA 
GTTGGACGAG CCACTACGCT AAAGATCGAA GCGCTCAAAG GCTCGAATAT GACGGACCAT 
GTCATGCTGG GCGGCTTTCT GGCCTATGGT ACGCCTGCGG CAGGTACTAC GCCCGCCCTC 
GAAACAGCTT ACAAGCCAAC GGGTATTACG TCGGTATGGG CTGAGCTGAT GGGCAATGGC 
AAAACCATTA TCCCGGCCAT TTTTGTCGGA TATACCAAGA ATACCGGAAA CGATCCCAAT 
GCGGTGGCTG CGTACGGACG CGGCATTGGG ATTGGCGGAC GCGGAGGCAT CGATAATCTG 
TTTCGGATAG CCCCCCGACT GGAAGTTGTT TCGGGCCGGT TTCGCGTTGG AACCGAGCTG 
GAGCTAACTA CGGCTGGCTA CGGTACGTCG TCAACAGATG CCAGGGTTAC TGCTGCTGAG 
CAAATAACGA ATACTCGTTT GTTGCTGACA ACAGTATATT CTTTCTAA

Protein sequence

MKLSYSFTLT SLGLLLSGAA WSQSTAPQLS TVATPVTTLN SIPPSNAGQA VGTNKPAETS 
AVTLKFTGFV RNDFSFDSRQ TVNLREASVD LYPRDKQVDV NGVDVNAVTN FNMLAINSRL 
GAVFTGPDAF GAKTSGLLEM EWFGPSDAAV GGVRLRHAWA KLDWPKRQLA FGQFWHPLFV 
PEVFPGVVNF NTGIPFQPFN RSPQIRLTEY LSKDVSLILA LIAQRDFTSI GISGSSSEYI 
RNTAVPNLHA QLQVKKGRVV AGLAFDYKMI RPRLSTGSGT SLLVSKATVG SSAVMAYLKV 
VGRATTLKIE ALKGSNMTDH VMLGGFLAYG TPAAGTTPAL ETAYKPTGIT SVWAELMGNG 
KTIIPAIFVG YTKNTGNDPN AVAAYGRGIG IGGRGGIDNL FRIAPRLEVV SGRFRVGTEL 
ELTTAGYGTS STDARVTAAE QITNTRLLLT TVYSF