Gene TK90_1358 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TK90_1358
Symbol
ID	8807124
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thioalkalivibrio sp. K90mix
Kingdom	Bacteria
Replicon accession	NC_013889
Strand	+
Start bp	1450876
End bp	1452075
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	66%
IMG OID
Product	tryptophan synthase, beta subunit
Protein accession	YP_003460600
Protein GI	289208534
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.33574
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTACC TGAAGGATTT TCCGAACCAG GAAGGCTTTT TCGGCGAGTT CGGGGGTGCG 
TTCCTGCCCC CCGAACTGGA ACCGCATTTT GCCGAGATCA ACCGGGCCTA CCTCGCCCTC 
GCCCGCTCGG CCGATTTCCT GAACGAGCTG CGCTACATCC GCAAGCACTA TCAGGGTCGC 
CCCACCCCGG TGTACTACGC CCACAACCTG AGCCGCGAGG CCGGCGCACA TATCTATCTC 
AAGCGCGAAG ACCTGAACCA CTCCGGAGCA CACAAGCTGA ACCACTGCAT GGGCGAGGCC 
CTGCTGGCCA AGCACATGGG CAAGCGCAAG CTGATCGCCG AGACCGGCGC CGGCCAGCAC 
GGGGTCGCGC TGGCCACGGC AGCTGCCTAC TTCGGCATGG AATGCGAGAT CCACATGGGC 
GAGATCGACA TCGCCAAGGA AGCGCCCAAC GTCACCCGCA TGAAGCTCAT GGGCGCACAG 
GTCGTGCCGG TGTCCTTCGG CGGGCGCTCG CTCAAGGAGG CCGTGGACTC CGCCTTCCAG 
TCCTACCTGT CGCAAGCCGA GCAGGCGCTG TTCGCGATCG GCTCCGTGGT GGGTCCGCAC 
CCCTTCCCGC TGATGGTGCG CAACTTCCAG TCGGTGGTCG GCATCAAGGC GCGCGAGCAG 
TTCATGGAGA TGACCGGCGG GGAACTGCCC GACCACGTGG TCGCCTGCGT TGGCGGCGGA 
TCCAACGCGA TGGGCATGTT TGCCGGCTTC ATCGAGGACG CCGGCGTCCA GCTGAACGGG 
GTCGAGCCAC TCGGACGCGG CACGACGCTG GGCGAGCACT CCGCCACCAT GACCTACGGC 
AAGCCCGGCA TGATCCACGG GTTCAAGTGC ATGTTGCTGG CCGACGAGGA AGGCAACCCG 
GCCCCGGTCC ACTCCATCGC CTCGGGCCTC GACTACCCCG GCGTCGGCCC GGAGCACTCC 
TACCTGAAGA CCATCGAGCG CGTGGCCTAC CATGCGATCA GCGACGACGA AACGCTGGAG 
GCCTTCTATC GACTGTCGCG CGCCGAGGGC ATCATTCCGG CGCTGGAGAG TGCCCATGCC 
GTCGCCTGGG CGATGAAATA TGGCCGCGAG AATCCCGGCG TCACGATCCT CGCCAACCTG 
TCCGGCCGGG GCGACAAGGA CATCGACTAC GTCACCCGCG AATTCGGCCA CGGCGACTAA

Protein sequence

MSYLKDFPNQ EGFFGEFGGA FLPPELEPHF AEINRAYLAL ARSADFLNEL RYIRKHYQGR 
PTPVYYAHNL SREAGAHIYL KREDLNHSGA HKLNHCMGEA LLAKHMGKRK LIAETGAGQH 
GVALATAAAY FGMECEIHMG EIDIAKEAPN VTRMKLMGAQ VVPVSFGGRS LKEAVDSAFQ 
SYLSQAEQAL FAIGSVVGPH PFPLMVRNFQ SVVGIKAREQ FMEMTGGELP DHVVACVGGG 
SNAMGMFAGF IEDAGVQLNG VEPLGRGTTL GEHSATMTYG KPGMIHGFKC MLLADEEGNP 
APVHSIASGL DYPGVGPEHS YLKTIERVAY HAISDDETLE AFYRLSRAEG IIPALESAHA 
VAWAMKYGRE NPGVTILANL SGRGDKDIDY VTREFGHGD