Gene GWCH70_1514 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_1514
Symbol
ID	7976601
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	+
Start bp	1586744
End bp	1588402
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	54%
IMG OID	644798411
Product	transposase
Protein accession	YP_002949584
Protein GI	239826960
COG category	[L] Replication, recombination and repair
COG ID	[COG5421] Transposase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGTTC AAGTCAAAAA GGTCTATCGC AATTCTTATT TGAATATAAT AAGTGCCCTA 
TTCAAGAAAC TGGGTCTGCC TCAATTGATT GACCATCTCG TGCCCGTCGA TCCGCAGTGC 
CAAACGCGAG TCAGCGATGC CGTTCAGGCC ATCCTCTACA ATGTGTTTGA CGGCCGGCAA 
GCCCTTGTTC ACTTGGAACA TTGGGCTCAG GAGGTCGATT GTGAGAAACT CATCCGTCCC 
GATCTCCATC CTTCCTGGTT GAACGACGAT GCGTTGGCCC GTCATCTCGA TCGCCTGTAT 
GAGGCTGGCA TTCACAACGT CATCAGCACT TGCTTGATTC ATATTTATCG AAAAGAAGGC 
CTTTCCCTCC GAGCCTTCCA CGCCGATACG ACGGACAAGA CCGTTTACGG CGCGTATGAA 
TCGGCCTCGT TAGAGGCCTT ACAAATCACA CATGGCTACA ACCGCCATCA TCGTTGGCAA 
AAACAGATCG GTTTCGGACT GGTCGGCAAC GAGGACGGCA TCCCGTTTTA CGGCGATGTG 
CACGATGGCA ACCTGCCCGA TAAAACATGG AATCCCGAGG TGCTGTCTCG TGTCCATGAA 
CAGCTGAAGC AGGCCAAAAT CGAAGACGAA TGGATTTACG TGGCCGATTC CGCCGCGATG 
ACGAAAGAGA CCCTGGCGCA AACCAAAGCG GCCAACGCCT TTTTGATCAC CAGAGGCCCT 
TCGTCGCTCC GGATCGTGAA AACCGCGCTG GCCGAAGCGG ATGCTGAGGA CACGACGTGG 
AGCGATCCCT TTACGTTGGC GGAGAGAAAC GGCGCCACGT ACCGGGTATG GGAAACGGCC 
TCGACGTATG AAGGCCACCC CGTTCGGCTG ATCGTTGTTG AATCGAGCGC GCTCGACCAG 
CGAAAAGGAA AGACGCTTGA AAAAGAACGA ACCAAAGAAG CGGAGCTTCT TCGCGAGGAA 
CAAGCCCGTT GGGAGCGTCA CCCCTTCTCC TGCCGGGAAG ATGCCGAACA AGCCTTGGCG 
TCCCTCAAGG CGTCCCTTCG CCCCCGGTTT CATCGGGTTG AGGCCGCGGT CGAAGAGATC 
GTACGCCTGA AAAAACGGCG CGGACGGCCG AAAAAAGGGG CGGAACCCGA GGTGGAGACG 
CTGTATTTCT TGCACCTTGA CGTCGAATTC GACCAAGACG CGTGGGAACA GGCGAGACGG 
AAAGCGTCCC GGTTTGTCCT TGTCACGACC GTTCCGAAGG AATGGAAGGG CCAACCCATG 
GATGCCCAAG AGATCTTGAA GCTGTATAAA GGGCAGATCT CGGTGGAAAT GAACTTCGCT 
TTTTTGAAAG ATCCGTTTTT CACGGATGAG ATTTACGTCA AAAAACCAGA ACGGGTCGCA 
GTATTAGGCT ATTTGTTTCT GTTGGCCTTG GCTATTTACC GCGTTTTTCA GCGCCGAGTG 
CGTCAGTTTA TTACTCCAGA ACACCCGTTG AAGGGTCCTG GAGGCCGCAA GCTGACCCGG 
CCGACGGGAC AGGCGATTTT TCAGCTGTTT CAATATGTGA ACGTCGTCCT GTTCAAGCTG 
CCGGATGGGC GCATCCAACG CTCACTGGAT CGCTCCCTTA CCCCTGATCA GCGAAGGATT 
CTGCAGGGAT TGGGCATGGA TGAGAGCATC TACGTGTAA

Protein sequence

MNVQVKKVYR NSYLNIISAL FKKLGLPQLI DHLVPVDPQC QTRVSDAVQA ILYNVFDGRQ 
ALVHLEHWAQ EVDCEKLIRP DLHPSWLNDD ALARHLDRLY EAGIHNVIST CLIHIYRKEG 
LSLRAFHADT TDKTVYGAYE SASLEALQIT HGYNRHHRWQ KQIGFGLVGN EDGIPFYGDV 
HDGNLPDKTW NPEVLSRVHE QLKQAKIEDE WIYVADSAAM TKETLAQTKA ANAFLITRGP 
SSLRIVKTAL AEADAEDTTW SDPFTLAERN GATYRVWETA STYEGHPVRL IVVESSALDQ 
RKGKTLEKER TKEAELLREE QARWERHPFS CREDAEQALA SLKASLRPRF HRVEAAVEEI 
VRLKKRRGRP KKGAEPEVET LYFLHLDVEF DQDAWEQARR KASRFVLVTT VPKEWKGQPM 
DAQEILKLYK GQISVEMNFA FLKDPFFTDE IYVKKPERVA VLGYLFLLAL AIYRVFQRRV 
RQFITPEHPL KGPGGRKLTR PTGQAIFQLF QYVNVVLFKL PDGRIQRSLD RSLTPDQRRI 
LQGLGMDESI YV