Gene Slin_5419 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_5419
Symbol
ID	8729186
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	6590496
End bp	6593804
Gene Length	3309 bp
Protein Length	1102 aa
Translation table	11
GC content	51%
IMG OID
Product	TonB-dependent receptor plug
Protein accession	YP_003390185
Protein GI	284040255
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAACG TAAATTCTAC CCTACTCAGG TTGATGCAAC TTACCGGTCT GCAACTCCTG 
CTAGCCGTAC TTTTTATGGG TGTTTCGTGG GCAAATGATG TCTCGGCCCA GGAACTGCTC 
AACCGGCGAA TAAGCCTGGT TGTCCGCGAT CAGCATATCA AGACTGTACT GCAAAGCATT 
GAGAAAGCGG CTAATGTCAA ATTCTCATAT AGCCCGCAAA TTGTTCGCTC CAGACAGCTT 
GTTTCGATGC GCGTGCAGAA CAGTACCTTA AAGGAGGTAC TGGAGAAGCT GCTTATCCCG 
TTAAACGTCA ATTTCAGCAT CTCCGGCGAA CAGATTATTC TGGCGCGTAC GGCTGAGCAG 
TCCATCAGCA TTCAGGCAGG TGAAGCCGTT GAAGAGGTCG AAGCACCCGC CGAACGGACC 
ATAACCGGGG TGGTGTCCGA CGAAAAAGGC GAAGGCTTAC CCGGCGTCAG TGTAGTCGTT 
AAAGGCTCGC CCCGTGGTGC CGTAACCGAC GCGTCGGGAA CGTATCGGTT AACCATCCCC 
GATGGTACTC AAACGCTGGT TTTTAGCTTT GTGGGATATG CCTCGCAGGA AGTGGCCGTT 
ACCAGCCAGT CAACGCTGTC GGTACAGCTC AAGCCCGACG TAAAATCCAT CAATGAGGTT 
GTCGTGGTGG GGTATGGCTC GCTGAACCGC AAAGAAGTGA CCAGCGCCGT CACGCACTTG 
TCCTCATCCG ACCTGCTGCG AGTGGGCAGC AACAGCCCGT TAATGGCGAT TCAGGGTAAA 
GTGGCGGGTT TATCCGTGAC CAATACGGCC GCCGGCGACC CCAACTCTAC ACCCAGCATT 
CAGCTTCGTG GGGTATCGTC GAGAAGCGCC GGGCTGGGGC CTTTGTTTGT GATCAACGGC 
ATACCCGGCG GCAACCTGGA CAACATCAAC CAGAACGAGA TCGAATCCAT TGATGTCCTG 
AAAGGCGGGG CCGCTTCGGC CATCTACGGC ACACGGGGTA GTAACGGGGT TATCGTGATC 
ACCACCAAGA AGGGATCGTC GGAATCCCGC ATCTTCTACG ATGGGTACTC GTCCTTTGAT 
TACATTACCA ATAGGCTGAA TTTGTTGAAT AGAGATGAAT TTCTGGCTAA TAAACGCGGT 
GTCGATCTGG GTGGTAATAC CGACTGGATG AAAGCGGTAA GCCGCAATCC GGCTTTTTCA 
CAGAAACATA CCCTGCAGTT TTCGGGCGGG AACGGGCAAA CCAACTACTT CACCTCGCTC 
GACTACCGCA ATGCTACAGG TATTGATCTA CGGTCGGCCA AACAGGAATA CGGTGGCCGG 
GTAAACATCA ACCATACCTC GGCTAACAAC CTGTATGCCA TTACCTTCAC AGCAGCACCC 
CGGTATACAA AGACCAGCCT GGCCGATTAC AGTGGGTTTA ATTACGCGTT GACGCTTAAC 
CCAACCCAGT CACTTTACGA CAATGCGGGA AAGTATGCGT ACATAACCAG CGGTTTTTTT 
GCGAATAATC CCGTCGAACG GGCAAAAAGT GTTCTATCGG GGCAGGAAGT GAAGTACCTG 
GACATCAACA GTTCATTTAA GCTGAACATC CTTCCGAATC TATCGACCCT GGTTACGCTG 
GGGGAAGTGA GTTCTTCTTT CCGGAATGAA GATTTCACGC CATCGACCCT GACAACGGTG 
GTCAATGGGT CAAAACGAAA CACTGCATCG CAGAGACTGG ACGAGAATGA TCAGAAAAGC 
TTTGAGTGGA CGGGTAATTA TGCGCTGGAA GTCCAGAAGC ACGCCATTAA GTTACTGGGC 
GGTTACTCGT ACCAATATTT TACGTCTTCC GGTTTCAACG CGTCCAACGA AAACTTCCCT 
TCCGATGTAC TTACGTATAA TAGTCTGGGT ACGGGGCTCT GGAACTTACA GCAGGGCATC 
AATAACGTAG GCTCTTACCG GAACAACTCC AAGCTGGCGG CTTTCTTCGG ACGCGTAAAC 
TACGACTTCG ACCAGAAGTA TTACCTGTCG GCCAGTCTTC GCCGGGAGGG GTCGTCCAAG 
TTTGGCTACG ATAACAAATG GGGGAATTTC CCGGCGGCAT CGGTCGGCTG GCGCATCACG 
CAGGAAAAAT TTGCGCAGGG TATCCCCGTG TTAAACGAAC TGAAACTCCG TGCCGATTAT 
GGCGTTACGG GCAACCAGGA CTTCGGCAAT TACCTCTCGC TGGATACGTA CGGCGGTTAC 
GGCTATTATC TCTACAACAA CACATCGTAT CAGGTTTGGG GACCCAGCCA GAACACCAAC 
TACAATCTTC GCTGGGAAAA AGCCATCAAC TTCAACGTGG GTGTCGACTT CGATCTGTTC 
AAGAACAGCC GCTTAACGGG TAGCCTGAAC TACTACGTGC GGACCAACAA AGATTTGCTG 
GGGTCCTATG CCGTACCTAA CCCGCCAAAC GTACAGGGAT CGACCTTTGC CAACGTGGGT 
ACCATGCAGA ATTTGGGTCT GGAAATCCAG CTGAACGCGG CTGTGGTCAA CAAAAAGGAC 
TTTAGTTATA ATTTAACTTT TGCCGGAGCG ACAAACAGCA ACAAGTTCGT TTCATTCTCC 
AGCGAAGCGT TTAAAGGACA AACGTATATC GACGTATTAG GTATGCCCGC CCCTGGTAGC 
CCCGGCAACG CGCAGCGCCT TCAGGAAAAC ACTCGGATCG GCAGCTTTTA TATGCTTCGG 
TCGGCTGGAG TCGATGAAAC CGGCGCGTTA CTGGTCTATA AAAAGAACGG CGATGTTATC 
CAGGCCAATA AAGCCAGCAA CGACGATAAA CAGTTTGTCG GAAATGGCCT GCCCAAGTTC 
ACGGCGGGGC TGACCAATAC CTTCAAATAC CGGAAATGGG ATTTGAGCGT CTTTCTACGT 
GGCTCGTTTG GTTACCAGAT TTTCAACACG TATGCGTTCT ATCTGGGAAC ACCGGCCACC 
CAGCAGAATA TCAATACGCT TACCTCGGCT TATAACGGAA GCAAGTACTC AAAGCTGAGC 
AACACTGCTA CCTATTCCTC GCTGTCCGAT TACTTTCTGG AGCCCGGTAG CTTCATCAAA 
GTCGATAATA TAACGCTGAG CTACACGCAG CCTTTTACAA GCAAATTCCT GCGCTCGGCG 
CGTATTTATG CAACAACCCG CAATCTGCTC ACCATCACCA AGTTCACCGG TGGCGATCCT 
GACTTAGTTC AGATAAACGG CTTGTATCCG GGAATCAATC AACGTAATGA TAACGGCAAT 
ATCGTTGGTA CACTGAATTA CTTCCCATCA ACGACCCAAC TCCTGCTGGG CCTTCAGGTC 
ACCTTTTAA

Protein sequence

MKNVNSTLLR LMQLTGLQLL LAVLFMGVSW ANDVSAQELL NRRISLVVRD QHIKTVLQSI 
EKAANVKFSY SPQIVRSRQL VSMRVQNSTL KEVLEKLLIP LNVNFSISGE QIILARTAEQ 
SISIQAGEAV EEVEAPAERT ITGVVSDEKG EGLPGVSVVV KGSPRGAVTD ASGTYRLTIP 
DGTQTLVFSF VGYASQEVAV TSQSTLSVQL KPDVKSINEV VVVGYGSLNR KEVTSAVTHL 
SSSDLLRVGS NSPLMAIQGK VAGLSVTNTA AGDPNSTPSI QLRGVSSRSA GLGPLFVING 
IPGGNLDNIN QNEIESIDVL KGGAASAIYG TRGSNGVIVI TTKKGSSESR IFYDGYSSFD 
YITNRLNLLN RDEFLANKRG VDLGGNTDWM KAVSRNPAFS QKHTLQFSGG NGQTNYFTSL 
DYRNATGIDL RSAKQEYGGR VNINHTSANN LYAITFTAAP RYTKTSLADY SGFNYALTLN 
PTQSLYDNAG KYAYITSGFF ANNPVERAKS VLSGQEVKYL DINSSFKLNI LPNLSTLVTL 
GEVSSSFRNE DFTPSTLTTV VNGSKRNTAS QRLDENDQKS FEWTGNYALE VQKHAIKLLG 
GYSYQYFTSS GFNASNENFP SDVLTYNSLG TGLWNLQQGI NNVGSYRNNS KLAAFFGRVN 
YDFDQKYYLS ASLRREGSSK FGYDNKWGNF PAASVGWRIT QEKFAQGIPV LNELKLRADY 
GVTGNQDFGN YLSLDTYGGY GYYLYNNTSY QVWGPSQNTN YNLRWEKAIN FNVGVDFDLF 
KNSRLTGSLN YYVRTNKDLL GSYAVPNPPN VQGSTFANVG TMQNLGLEIQ LNAAVVNKKD 
FSYNLTFAGA TNSNKFVSFS SEAFKGQTYI DVLGMPAPGS PGNAQRLQEN TRIGSFYMLR 
SAGVDETGAL LVYKKNGDVI QANKASNDDK QFVGNGLPKF TAGLTNTFKY RKWDLSVFLR 
GSFGYQIFNT YAFYLGTPAT QQNINTLTSA YNGSKYSKLS NTATYSSLSD YFLEPGSFIK 
VDNITLSYTQ PFTSKFLRSA RIYATTRNLL TITKFTGGDP DLVQINGLYP GINQRNDNGN 
IVGTLNYFPS TTQLLLGLQV TF