Gene GWCH70_1416 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_1416
Symbol
ID	7979192
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	+
Start bp	1486780
End bp	1488153
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	49%
IMG OID	644798336
Product	transposase IS4 family protein
Protein accession	YP_002949509
Protein GI	239826885
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.000000673516
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGATT TCCCGATTCG GTTTGTATTG ACAGATGAAG CGATTACCCC AAGTGCTGGG 
CTTGCTCTCG TTGGCTACTT ACTGCACCAA ACGAAGCTGG ATAAACGAGT AAACGCCCTT 
CGGCTCCCAA CGGTTCGTCG AGATGTGCAC ATTTCCCATA GCGACGTCAT TCGCTCGATG 
ATCGGCTTGC TTGCCACAGG AAAAACGGAT TTCGATCATA TCGAAGCGTA TCGTCAGGAC 
GATATCTTTT CGGCATCGAT GGGGATTCAG CACGTACCTT CCTCTCCAAC CTTGCGACAA 
CGACTCGATC AGCTCGCTTG TCTTCCGATG ACCGAAACCA TCATTTGGGA GGAATCGATG 
CGTCTGTTGG TTCGACAACA CGCTACCTTG TCCCCTTGTT GGACGAAAGG GAAAACGACA 
TGGCTTCCCC TTGATATAGA TGCTTCCCCA TTTGACAACT CCGATACGAA AAAAGAAGGA 
GTCAGTCGAA CGTATAAAGG ATTTGACGGT TTTACACCGT TGTTTGCGTA TGCAGGGAAG 
GAAGGGTATC TCGTTCATGC CGAGTTGCGT CCAGGGAAAC AACATGTGCA AGACAACATG 
CCCTCGTTTT TAGTCACCGC TATCCGTCGA GCTCGTCAAC TGACTTCATC TCGTCTGCTT 
GTTCGCATGG ATGCAGGAAA CGATGCAGAA GCGAATGTGC ACGTATGCCT AAAGGAAGAC 
GTGGACTTTG TCATCAAGCG AAACTTACGC CGAGAATCGA AAGCGCTTTG GTTCCAGATC 
GCTTCGCAAA AGGGCAGACG CGTCGATGAT GGACAAAGCG AAGGAGTACA AACCTATGAG 
CTATGCCTTC CACAGAAGGC AGTGATCGAT GGAAACACGT ATACGTACGT TCAAGTCACC 
CAAGTGACGG AACGGACGAT GGAACGCAAT GGACAGCTGA TGCTCGTTCC TGATTATGAA 
GTGGAAAGCT ATTGGGTGCG GCTCAAAGGA TACGAGCATG TTCGAATGAG CGATGTGCTC 
GCGTTGTATC ATGACCATGC GACATGCGAA CAGTTTCATA GCGAACTGAA GAGCGACTTA 
GATTTAGAGC GGCTTCCATC TGGGAAGATG AAAACGAATG CGCTCGTGTT GGTCATGGGA 
GCCTTCGTTT ACAATCTTCT TCGTCTGATT GGACAAGATC TATTAAGCGA TCCGAGACAT 
CCGTTGCACC ACAAAGTGAA ACGCCGTCGC ATCAAGACGA TTATTCAGAC GGTGATCACG 
ATGGCAGGTC GACTCGTCCG CCGATCACGA CAGATCTGGA TGAAACTGAC GCGAAGGAGT 
GGGTACAGTA TACTCCTACT GAATGTGTAT CAAAAATGGA AAGAGGCAAG ATAA

Protein sequence

MKDFPIRFVL TDEAITPSAG LALVGYLLHQ TKLDKRVNAL RLPTVRRDVH ISHSDVIRSM 
IGLLATGKTD FDHIEAYRQD DIFSASMGIQ HVPSSPTLRQ RLDQLACLPM TETIIWEESM 
RLLVRQHATL SPCWTKGKTT WLPLDIDASP FDNSDTKKEG VSRTYKGFDG FTPLFAYAGK 
EGYLVHAELR PGKQHVQDNM PSFLVTAIRR ARQLTSSRLL VRMDAGNDAE ANVHVCLKED 
VDFVIKRNLR RESKALWFQI ASQKGRRVDD GQSEGVQTYE LCLPQKAVID GNTYTYVQVT 
QVTERTMERN GQLMLVPDYE VESYWVRLKG YEHVRMSDVL ALYHDHATCE QFHSELKSDL 
DLERLPSGKM KTNALVLVMG AFVYNLLRLI GQDLLSDPRH PLHHKVKRRR IKTIIQTVIT 
MAGRLVRRSR QIWMKLTRRS GYSILLLNVY QKWKEAR