Gene Slin_4237 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_4237
Symbol
ID	8727996
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	-
Start bp	5110702
End bp	5112438
Gene Length	1737 bp
Protein Length	578 aa
Translation table	11
GC content	51%
IMG OID
Product	hypothetical protein
Protein accession	YP_003389020
Protein GI	284039090
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.46126
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAATA CTAAAAACAT TGTCAGGACA CTGGCACTGG CTGGAGTTAT AAGCATAGCC 
AGCTCGTGTA ACTATACCGA TCTGGATATC AATACAGATC CCAACAAACC GGCAACTGGT 
TCGCTGGGTC TGCTGTTGCC GGTAGCTGAA AATGCCGCTC GTGACGCGTT TACGAGTGTC 
AATAGCGGTG CGATGAGTTT TGCGGGTTTG TGGAATTCCA GTAATGCAAC CACCTCCTAC 
AACCTGAGCA ATACTGACTT CCAGACCACT TGGAATGATG CGTATCGAAA TATGCAGAAC 
ATGGAGGAGA TGCTGCGGGC TACGGAAGAC GGTAAGAATC CCCGCTATCG GGGAATTGCC 
CTAGTGCTCA AGGCCTATGC GATGGGTAAC TATGTGGATA TGTTTGGCGA TATGCCGTAC 
ACAGAAGCCT GGAAAGGTAA TGCAGCCCAA CAGAATACAT CCCCTGTATT CGATAAGGAC 
GCAGCTATTT ACGAGGATCT GATTAAACTG TGCGATCAGG CCGTTGTGGA ACTGGCTAAA 
CCCCAGCCCG TTGCCGTAAT CAATGACTAC ATGGGTGGAG GTAATGCAAC GACCTGGACG 
CGCATTGCCA GAACGGTTAA GCTGCGTTTG TTACTTAACT CGCGCAAAGG CCGTACCAAT 
GGTAATGCTG AATTGAAGGC GGCTTTCGAC GCAGGTGGAT TTATTTCAAC ACCAGCGCAA 
AACTGGTCCT ACCTGTATTC CAAGCAGATT TCACCCGAGC GCAACACCCA CCCCTGGTTT 
ATTACCTACA CGGGTACGTC TGATCCTAAC TACATCAACC ACCAGTTGAT GGGCGAAATG 
ATTCTGAATA AAGATCCACG TCTGCCTTTC TACTTCTACC GGCAAACATC ACGGATTCTG 
GACCAAAACA ACCCAACCGA CCGGGGTACC ACGCCGTTTG GTGGATCGTA CCTGCCGCTC 
CGGGCGTCAT TCCTCGATGA ATACAAGAGC GTATTTGGTA TCACCGGAGC TATTCCTACT 
GCTGATCTGG CTTACATCGC CGGTTACTTC GGACGCGATC GGGCCGATGT ATCGGGTGCT 
GCTGCTGATG GTCCACTACG GACGGCCCCC GGCACCTATC CGGCGGGTGG CGTTTATTCT 
GATCGGAGCG TACCTGCTGT AGCGCTGACG GGTCAGGCAT CGCTGAACTT TGGTGGCGAT 
GGTATGTGGC CACTGATCCA TAGCTGGAAC ACGAAATATT ATCAGGTGGA AGCTATTCTG 
GACGGAACTG GTGTAACAGG TGACCCCAGA GCTCTTTTTG AAGCTGCTAT GCGTGAGCAG 
ATTGCCGTGG TTGTGGCTCA AGGCCTTAAA TCAGATCCCA CCCGTGCCAA AGCACCGGCC 
CAGACCGAAG TGGATGCCTA TGTAAAAGCA TGGCTGGATT TGTATGATGC GGCTACATCC 
GCCCAGTCAA AATTGAACGT GGTCGCCAAG CAAATCTGGT TCTGCTCCTG GGGACAGGGT 
ATGGATATCT GGAACTTACA GCGCCGAACC GGCTACCCCA TTCAAAGCCA GTTCAAACAG 
TTCTCGGTAG GGATTCAGGC TCCAATTTCA AAGCCACCCC GTCAGTATGC GCTTCGCTTA 
CCCTATCCGC AGTCTGAAGG TGCCCTGAAT CCGAATGCAG CTAAATACGT TGCCGATGTG 
ATTTTCGACC GGGATCCAAT TTTCTGGGAC AAGGTAAAAG TTAAGTGGGA GTACTAG

Protein sequence

MINTKNIVRT LALAGVISIA SSCNYTDLDI NTDPNKPATG SLGLLLPVAE NAARDAFTSV 
NSGAMSFAGL WNSSNATTSY NLSNTDFQTT WNDAYRNMQN MEEMLRATED GKNPRYRGIA 
LVLKAYAMGN YVDMFGDMPY TEAWKGNAAQ QNTSPVFDKD AAIYEDLIKL CDQAVVELAK 
PQPVAVINDY MGGGNATTWT RIARTVKLRL LLNSRKGRTN GNAELKAAFD AGGFISTPAQ 
NWSYLYSKQI SPERNTHPWF ITYTGTSDPN YINHQLMGEM ILNKDPRLPF YFYRQTSRIL 
DQNNPTDRGT TPFGGSYLPL RASFLDEYKS VFGITGAIPT ADLAYIAGYF GRDRADVSGA 
AADGPLRTAP GTYPAGGVYS DRSVPAVALT GQASLNFGGD GMWPLIHSWN TKYYQVEAIL 
DGTGVTGDPR ALFEAAMREQ IAVVVAQGLK SDPTRAKAPA QTEVDAYVKA WLDLYDAATS 
AQSKLNVVAK QIWFCSWGQG MDIWNLQRRT GYPIQSQFKQ FSVGIQAPIS KPPRQYALRL 
PYPQSEGALN PNAAKYVADV IFDRDPIFWD KVKVKWEY