Gene Slin_2594 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_2594
Symbol
ID	8726339
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	-
Start bp	3134954
End bp	3136999
Gene Length	2046 bp
Protein Length	681 aa
Translation table	11
GC content	53%
IMG OID
Product	transketolase
Protein accession	YP_003387411
Protein GI	284037481
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.123442
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTACTC AATCGGTCAA CCTCGACCAA CTCAGTATCA ATACCATCCG GCTTTTGTCG 
GTTGATGCGG TTCAGAAAGC CAATTCCGGA CACCCTGGCT TGCCGCTTGG CGCGGCTCCC 
ATGGCGTATG TTCTCTGGTC GCGCTTTTTG CGGTTTAATC CACAAGACCC GCACTGGCCG 
GATCGGGATC GGTTTGTGCT CTCTGCCGGG CACGGTTCGG CTTTGTTGTA CAGCTTATTG 
CATTTGTATG GGTACGATCT GTCGCTTGAT GATATAAAAG GTTTCCGGCA AATTCATTCC 
CGCACACCGG GTCACCCCGA GTCGAACCTA ACACCGGGAG TTGAAGTAAC CACTGGCCCG 
CTTGGACAAG GGTTTGCCAA CGGGGTAGGC ATGGCCATGG CCGAAGCATT TTTGGCCGCA 
GCCTACAATC GGGAAGGACA CACAGTCATG GACCATTATA CCTACTCCAT TGTGAGTGAT 
GGCGATTTAA TGGAAGGGAT TGCGTCTGAA GCGGCTTCGC TGGCGGGCCA CCTTAAGTTG 
GGGAAGCTGA TTTATTTGTA CGACGATAAC CTCATTTCGC TGGATGGGCC TACTAATCTA 
GCGTTTACGG AAGACCGAAT GGCGCGTTTC GATGCGTATG GCTGGCATAC GCAGCATGTG 
GCCGATGGCA ACGATCTGGA CGCTATTGAA GCGGCCATTC GCGCAGCCCA GGCCGAGACG 
GATCGCCCGT CTATCATTGC CGTCCGTACG GTTATCGGCT TTGGCAGCCC AATGGAAGGA 
ACCAGCAAAG TACACGGTAG CCCGCTGGGC GATGAAAATC TACGGAAAAC CAAAGCGTTT 
TATGGTTTCG ACCCAGACCA GTCATTTGTC ATTCCGGATG AAGTAAAACC TCATTTGTTG 
GAAGCAGGCA AGCGGGGTGC CGAGCTTCAG GCCGACTGGC AAAAACGGTT TGAGGCTTAC 
AGAAACCAGT TCTCGGATCA GGCAGAGCTA TTTGACGTGT CATTTGCGGG TAAGTTCCCC 
GACGATTGGG AAACCGATCT GCCCAAGTTT GCACCTGCTG ATGGCCCACT GGCCACCCGG 
CAGGCCTCTG GCAAAGCCCT GGAAGCCCTG AAAAAACGAG TACCTTATCT CTTTGGTGGT 
TCCGCCGATC TGGCTTCATC CAATGAGATG CCAACGAAAG GCGACATTAG TTTTCAGCCC 
GGCCATTACG GAAACTCCAA CATCTGGTTT GGGGTACGTG AGCATGCCAT GGGAGCAGCC 
CTGAACGGAA TGGCCCAGCA CGGTGGCGTG CACCCGTACG GCGGCACATT CCTCAACTTT 
TCCGATTACA TGCGGGGAGC CATCCGGCTA ACGGCGTTGG CGGAATCGTC GGCGACGTTT 
GTATTTACGC ACGACAGCAT TGGCCTGGGT GAAGACGGAC CCACACACCA ACCCGTTGAA 
CAGGTCGTTT CGCTACGAAC CATACCAAAC ATTATTGTTT TGCGGCCGGC CGATGCCAAC 
GAAACCGTTG AAGCCTGGCG AGTGGCCCTG CAACAGCCAA AGACACCCGT AGTACTAATA 
CTCTCCCGGC AGAAACTGCC CGTGCTGGAT CAGGAAAAAT ACGGCTCGGC ACGTGGCCTG 
GAGAAGGGAG CTTATATTTT AAGCGAAGCC GATGGTACGC CCGAGCTCAT ATTGATTGCC 
ACAGGTTCTG AAGTGTCGTT GGTGCTGGAA GCGCAAGAGG AGCTAAAGAA ACAGGGCATT 
CAGGCGCGGG TTGTTAGCAT GCCTTCATGG GAGTTGTTCG AAAAGCAAGA TCAGGCCTAT 
CACCACGAAG TATTGCCGCC CTCGATTCGG AAGCGGCTTG CCGTAGAAAT GGGCTCGCCA 
ATTGGCTGGC ATAAATACGT GACAGATGAA GGAACAACGA TTAGTATGAA CCGATTTGGC 
TTGTCCGGCC CCGCCGAAGA AGTAATGGCT TACTTTGGCT TTACGGTGGA AAATGTAGTA 
AACACGGCTA AATCGGTACT GGACGGCAAT CCTGACGGTA TTGAGAAAAA AGAAGTATTG 
TCCTGA

Protein sequence

MTTQSVNLDQ LSINTIRLLS VDAVQKANSG HPGLPLGAAP MAYVLWSRFL RFNPQDPHWP 
DRDRFVLSAG HGSALLYSLL HLYGYDLSLD DIKGFRQIHS RTPGHPESNL TPGVEVTTGP 
LGQGFANGVG MAMAEAFLAA AYNREGHTVM DHYTYSIVSD GDLMEGIASE AASLAGHLKL 
GKLIYLYDDN LISLDGPTNL AFTEDRMARF DAYGWHTQHV ADGNDLDAIE AAIRAAQAET 
DRPSIIAVRT VIGFGSPMEG TSKVHGSPLG DENLRKTKAF YGFDPDQSFV IPDEVKPHLL 
EAGKRGAELQ ADWQKRFEAY RNQFSDQAEL FDVSFAGKFP DDWETDLPKF APADGPLATR 
QASGKALEAL KKRVPYLFGG SADLASSNEM PTKGDISFQP GHYGNSNIWF GVREHAMGAA 
LNGMAQHGGV HPYGGTFLNF SDYMRGAIRL TALAESSATF VFTHDSIGLG EDGPTHQPVE 
QVVSLRTIPN IIVLRPADAN ETVEAWRVAL QQPKTPVVLI LSRQKLPVLD QEKYGSARGL 
EKGAYILSEA DGTPELILIA TGSEVSLVLE AQEELKKQGI QARVVSMPSW ELFEKQDQAY 
HHEVLPPSIR KRLAVEMGSP IGWHKYVTDE GTTISMNRFG LSGPAEEVMA YFGFTVENVV 
NTAKSVLDGN PDGIEKKEVL S