Gene TK90_0342 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TK90_0342
Symbol
ID	8806073
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thioalkalivibrio sp. K90mix
Kingdom	Bacteria
Replicon accession	NC_013889
Strand	+
Start bp	361365
End bp	363113
Gene Length	1749 bp
Protein Length	582 aa
Translation table	11
GC content	69%
IMG OID
Product	Tetratricopeptide TPR_2 repeat protein
Protein accession	YP_003459593
Protein GI	289207527
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.351016
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATGGA GTAATCCGAT CGGACCCGAA ATGATTCGAC CCCTTTTTGT GGCACTGGCC 
GCGCTCGTGC TGGTGGGCTG CGCCCACATG CCCCTGGGCG CCTCGGAGGG CGAGGCCCTG 
GAGACGGATC GCCCCGTGAT CCTCCCGATC ATGCCGGCGC AGGACCCGGA AGCGGCCCTG 
ATGCTGGGGG TGCTGGTCGG CGAGATCGCC GTGCGCTCCG GGCAGTACGA AGAGGCCGCG 
CGCTACTACG GCGCCGCGGC CCTGCTCAGC GACGACCCGG CCATCGCCGA ACGGGCCACC 
CGCATTGCGC TGTTCGCCCG GGATCGCAAC CAGGCCCTGC AGTCTTCCGA GCGCTGGCGC 
CAGCTGGCAC CGGAGAGCCT GGATGCCCTG CAGTTGTCCA CGGTGCTGCG TCTGGACCTC 
GGGCAGCCGG ATCCGGCTGC CGAGCAAATG GGAACGGTGA TCGACCTGCA GGCCGTGCAG 
GGTGGAGACC CCTACGCGGC GCTTGGCGCG GTTGTCGGGC AGACACACAA CCGCGAGGCC 
GCGCTGGAGG CCCTGGAAAA GCTGACGGAT CAGCGTCAGG ACGACGTTGG TGTGCATCGC 
GTATTTGCCG AGGCGGCACT GCGCTTCGCG CCCGGCGATC CGGCACTGGA GGCGACCGCG 
CGGGGTGTGG AGCGCTTCCC GGAATCCGTG TCTTTGCGGC TGCTGCGCGC CCGCGCCCTG 
GACGAGGCGG GGCAGTCCGA CGAGGCGCTG GAGGAGCTGC GCGCGACGGT GGCCAACCAT 
CCGGAGAGCC GCGAGGCCCG TTTTGGCTAT GCCCGTATGC TGGCGGAGCA CGATGATCGC 
GAGATGGCGC GCGAAGAGAT GGACCGCCTG GTCGAGCAGG ACCCGGAGGA TGTGCAGCTG 
CTGCTGGCCC TGGCACTGAT GAACCTCGAG GCCGAACAAC TGGGGCCGGC CCGGACCTAT 
CTGGAGCGTC TGGACGCCCT GGGCGAGCGC GAGGACGACA TTGCCTACTA CCTGGGGCGG 
CTGCACGAGA TGGAAGACGA CCCGGAAGGC GCGCGCCAGG CCTACGAGCG GGTCGGGGGT 
GGCGGCCACG CCGATGATGC CCGCCTGCGC GCGGCGCGCA TGACGCTGGA GATCGAGGGC 
GAGTCGGCCG CGCGCGAGCG CTTCGAGCAG ATGCAGCAGG GTCCGGATAC CGAGCTTGCC 
CGACGTGCCT ATGTTGGCGA GGCGAACCTG CTGCGTGAAA AGGGCGAGTA CACGGCGGCG 
CGCGAACGCC TGAATCGGGG ACTGGTGCAG TTCCCCGGCG ATACCCGGTT GCTGTACATG 
CGCGGCCTGG TGCACGAGCG CCAGGATGAC ATCGAGGCCG CCGAGGCGGA TTTTCGCGCG 
ATCCTGGACA ACGATCCGGA GAACGTCGCC GCGCTGAATG CGCTGGGCTA TACGCTGGCG 
GACCGCACCG ACCGCTACGA GGAAGCGCTG GACCTGATCG AACGGGCCTA CGCGCAGGAG 
CCCGACGACG CAGCGATCAT CGACAGCTAT GGCTGGGTCC TCTATCGCCT CGGGCGGCTG 
GACGAGGCCG AGGACTTCCT GCGTCGCGCC TACGATCTCT CCGACGACGG CGAGATCGCG 
AGCAACCTCG CCGTGGTGCT CTGGGAGCGG GGCGAACGCG ACGAGGCACG CTCCATTCTG 
GAGGCGGCGC TGGAGCGCGA GCCGGATCAC GAGCGCCTGC TGCGGGTGCG TGACGAACTC 
CTCGAGTGA

Protein sequence

MKWSNPIGPE MIRPLFVALA ALVLVGCAHM PLGASEGEAL ETDRPVILPI MPAQDPEAAL 
MLGVLVGEIA VRSGQYEEAA RYYGAAALLS DDPAIAERAT RIALFARDRN QALQSSERWR 
QLAPESLDAL QLSTVLRLDL GQPDPAAEQM GTVIDLQAVQ GGDPYAALGA VVGQTHNREA 
ALEALEKLTD QRQDDVGVHR VFAEAALRFA PGDPALEATA RGVERFPESV SLRLLRARAL 
DEAGQSDEAL EELRATVANH PESREARFGY ARMLAEHDDR EMAREEMDRL VEQDPEDVQL 
LLALALMNLE AEQLGPARTY LERLDALGER EDDIAYYLGR LHEMEDDPEG ARQAYERVGG 
GGHADDARLR AARMTLEIEG ESAARERFEQ MQQGPDTELA RRAYVGEANL LREKGEYTAA 
RERLNRGLVQ FPGDTRLLYM RGLVHERQDD IEAAEADFRA ILDNDPENVA ALNALGYTLA 
DRTDRYEEAL DLIERAYAQE PDDAAIIDSY GWVLYRLGRL DEAEDFLRRA YDLSDDGEIA 
SNLAVVLWER GERDEARSIL EAALEREPDH ERLLRVRDEL LE