Gene TK90_1821 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TK90_1821
Symbol
ID	8807593
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thioalkalivibrio sp. K90mix
Kingdom	Bacteria
Replicon accession	NC_013889
Strand	-
Start bp	1936201
End bp	1937565
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	70%
IMG OID
Product	peptidase M24
Protein accession	YP_003461048
Protein GI	289208982
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0438992
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0000000354037
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACGCCC CCACGCGCCC CCCGCTGCCC GGCAAGACCC CGACCATCAC CCTGGCCGAG 
TTCGCCCGGC GGCGTCAGCG CCTGATGCGC GGCGTGGGGG GCGACTCGAT CATCGTCGTG 
CCGGCCGCAC ACGAGCAGGT GCGCAACCGC GATGTCGAGT ATCCGTTTCG CCAGAACAGC 
GACTTTCTCT ACCTGACGGG CTTCCCCGAG CCGGATGCCG TTGCCGTGCT CGTACCGGGT 
CGCGCGGCGG GGGAGTACAT CCTGTTCTGC CGCGACCGCG ACCCCACGCA GGAGACCTGG 
CAGGGCCGCC GCGCCGGCCC GGACGGGGCG ATGGAACAAT ACGGCGCGGA ATGCGCGTTC 
CCGATCGAGG ACATCGACGA GATCCTGCCG GGCCTGATGG AGAACCGGCG CGTGCTGTGC 
GCCCCGTTCG GGCGCGACGA GGCGCTGGAC CAGCGCCTGT TCGGCTGGGT CAACCAGGTC 
CGCGCGAAGG CCCGCAATGG CGTGCGCGCG CCGCACGAGT ACGTGGCGGT CGAGCACTAC 
GTGCACGAGC AGCGCCTGTT CAAGAAGGCC CCGGAGCTGC GCATGATGCG CCATGCGGCC 
GCGATCTCCT GCCAGGCCCA TATCCGGGCC ATGCAGGCGA CCCGCCCCGG CATGACCGAG 
TTTATGGTCG AGGCCGAGCT GCTGCATGAA TTCCACCGCC ACGGCACCGA GCCGGCGTAC 
TCGTCCATCG TCGGCGGTGG CGAGAACGGC TGCATCCTGC ACTACATCGA GAACCGCGAT 
GTCCTGAACG AAGGCGACCT GCTGCTGATC GACGCCGGCT GCGAGGTGCA TGGGTACGCC 
TCCGACATCA CCCGGACCTT CCCGGTCTCC GGGCGCTTCA GCGACACCCA GCGCGAGGTC 
TACGAGTGTG TACTGGCCGC GCAGCACGCG GCCATCGAGC AGACCCGTCC GGGCAACCAC 
TGGAACGACC CGCACGACGC CGCGGTGCGC GAGTTGACCC GCGGGCTCAA GGATCTCGGC 
GTACTCAAGG GTCGGCTCGA CAAGCTGCTC AAGGACCACG CCTACCGGCC CTTCTACATG 
CACCGGACCG GCCACTGGCT GGGCCTGGAC GTGCACGATG TCGGCGACTA CCGCGTCGGC 
GACGCCTGGC GCCTGCTGGA GCCGGGCATG GTGACCACCG TGGAGCCGGG GCTGTACTTC 
GGCCCGTACT CCGAGGCCCC CAAGGCGCTG CGCGGCATCG GCATCCGCAT CGAGGACGAC 
GTCGCCGTCT CCCGCGACGG ACACGAAGTC CTCACCGGCG CCTGCCCCAA GACCCCCGCC 
GACATCGAAG CCTGCATGGC CGGCGACCTC CCGGGCTGGA CCTGA

Protein sequence

MNAPTRPPLP GKTPTITLAE FARRRQRLMR GVGGDSIIVV PAAHEQVRNR DVEYPFRQNS 
DFLYLTGFPE PDAVAVLVPG RAAGEYILFC RDRDPTQETW QGRRAGPDGA MEQYGAECAF 
PIEDIDEILP GLMENRRVLC APFGRDEALD QRLFGWVNQV RAKARNGVRA PHEYVAVEHY 
VHEQRLFKKA PELRMMRHAA AISCQAHIRA MQATRPGMTE FMVEAELLHE FHRHGTEPAY 
SSIVGGGENG CILHYIENRD VLNEGDLLLI DAGCEVHGYA SDITRTFPVS GRFSDTQREV 
YECVLAAQHA AIEQTRPGNH WNDPHDAAVR ELTRGLKDLG VLKGRLDKLL KDHAYRPFYM 
HRTGHWLGLD VHDVGDYRVG DAWRLLEPGM VTTVEPGLYF GPYSEAPKAL RGIGIRIEDD 
VAVSRDGHEV LTGACPKTPA DIEACMAGDL PGWT