Gene TK90_2021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TK90_2021
Symbol
ID	8807796
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thioalkalivibrio sp. K90mix
Kingdom	Bacteria
Replicon accession	NC_013889
Strand	-
Start bp	2143343
End bp	2144482
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	70%
IMG OID
Product	Peptidase M23
Protein accession	YP_003461248
Protein GI	289209182
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCTGGCCC CCGCGGGCAC CGTGTCGGCG TTTGAACCAG AGGCCGAACT GGAGGAGACG 
CTGGAGGCCA TCCGCGACCT GGAGCGCAGC CAGGAGGAGC GCCAGGCGGC GCTCGAGCGC 
CTGGAGGACG AGCTCGAGCG GGCGGCCCGG GGCAGCAGCG AGTCGCGGCG CGAACTGCGC 
GAACTGGAGG CCGAACGCGA GCAGCAGGCC GAGGTGATCG CCGAGCACGA GGCACGTGTC 
GAACAGGAAG AGGATCGCCT GCGCGAAGAA CGCGTGCAGG CGGGGCGACT GCTGCGAGAC 
CAGTGGCAGC GCGACCGGCA CCCGGGGCGG GTGCCGGGTA CCGGTGGCGA CGGCGAGCTG 
AGCCGGCTGC ATCCGGAGAT CGCCGCGCGC TTGCGCGAGG CACGGGCCGA GGCACTGGCG 
GCCCTGGGCG AGCAACTCGA GGTGTTGCGG GCCGCCCGCG ATGATCTGGA GCGCGAGCAG 
GCGGTGCTGG CCGAGCAGGA GGCGGAGCTG CGCGAGGTGG TGGCCGAGCT CGAGCGCGAG 
GAGGAACGGC AGCGCGCGGC GATGGACGAG CTGGAACGCG CGATCGAGGA CGAGGCGCTG 
GAGCTGGCGC GCCTGGAGCG CAATGCCGAG ACGCTGGAGG AGCTGATCCG CGAGGTGGAG 
CGTGATGCGG CGGAGCGCGA AGAGCGCGCG GCGCGTGGCG ACCCTCCGCC CGATCGGGGG 
CCCGTACGGT CCGATGTGGC ATTTTCCGAC CTCCAGGGGG AACTCCCCAG ACCCGCCGAA 
GGCTCGGTCG TCCGGCGTTT CAACGAGCCG CGTGGCAGTC GTCTGCAGTC CCGTTGGCGG 
GGGACCGTTC TGGAGGTCGA CAATGGCGAG GCGGTACATG CCGTCCACTT TGGCCGCGTG 
GTCTACGCCG ACTGGATGCA GGGATACGGC TTTCTGGTCA TCCTCGATCA CGGGGGCGGT 
TACCTGACGC TGTACAGCAA CCTGGAGGAG ATCCTGGTCG CCGAGGGCGA GGAAATCGAA 
GGCGGCGAGC GCATGGCTCT GGCCGGCGCG GGTCGCGAGG CGATCGCGCC GGGGCTGTAC 
TTCGAAATTC GGCGAAATGG CGATCCGTTG AACCCTGAGG ATTGGTGGCT ATCTCAATGA

Protein sequence

MLAPAGTVSA FEPEAELEET LEAIRDLERS QEERQAALER LEDELERAAR GSSESRRELR 
ELEAEREQQA EVIAEHEARV EQEEDRLREE RVQAGRLLRD QWQRDRHPGR VPGTGGDGEL 
SRLHPEIAAR LREARAEALA ALGEQLEVLR AARDDLEREQ AVLAEQEAEL REVVAELERE 
EERQRAAMDE LERAIEDEAL ELARLERNAE TLEELIREVE RDAAEREERA ARGDPPPDRG 
PVRSDVAFSD LQGELPRPAE GSVVRRFNEP RGSRLQSRWR GTVLEVDNGE AVHAVHFGRV 
VYADWMQGYG FLVILDHGGG YLTLYSNLEE ILVAEGEEIE GGERMALAGA GREAIAPGLY 
FEIRRNGDPL NPEDWWLSQ