Gene GYMC61_1559 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GYMC61_1559
Symbol
ID	8525422
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. Y412MC61
Kingdom	Bacteria
Replicon accession	NC_013411
Strand	-
Start bp	1588906
End bp	1590573
Gene Length	1668 bp
Protein Length	555 aa
Translation table	11
GC content	53%
IMG OID
Product	transposase IS4 family protein
Protein accession	YP_003252678
Protein GI	261418996
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACATAC GACGAGTCAC ACGCAAAAAC AAGGATGGAA CAACCGTTGC TTATCTCCAG 
CTTGCTCACA ATGAATGGGA TCCAAAGGCC AAATATGCGA AAGCGAAGGT GATTTATTCG 
TTCGGGCGCG AAGACGAGGT GGATCGCGCC GTCTTGGAAC GTCTGGCCAA AAGCATTTCG 
CGATTCCTTT CTCCTGAGCA GGCTTGGGAA GTCGAAACGT TGACAGGAGA AGCTTCCGAT 
GACTTTCAAT TCCAGTCATG CAAACACCTC GGCGGCGTTT GGCTCTTGGA TCAGCTCTGG 
AGACAACTGG GGTTGGGAGA GATTCTCCAC TCCTTGTTTA CCTCCCGACA TCACCAGATT 
TCGCTGGAAC GGCTGATTTT TGCCATGGTG GCCAATCGCG CCCTTCATCC GTCAAGCAAG 
TTGGCGATGG AGGAGTGGGT GGAGAAAGAC GTGTATATCC CTCACCTTCC TCAAGCCGCC 
AGCCACCAGT TGTACCGGGC GATGGATGAG CTGCTGGCCG TGCAGCCGGA ATTGGAACGT 
CAAGTGTTCC ATGCTGTGGC CGATTTATTG AATTTGGAAG TCGACTTGAT TTACTTCGAT 
ACGACTTCGT CGTACTTCGA AGTGGATCCC TCTGAAACAC CGGAAGGAGA ATCGCTTCGA 
AAACAAGGAT TCTCGAAAGA CAAACGCCCA GACTTGGTTC AAATCGTCAT TGGGCTGGCT 
GTCACCCGGG AAGGAGTCCC GATTCGCGCT TGGGTATGGC CTGGCAATAC CATGGACATG 
ACGGTCATCA AACAGGTGAA ACAAGACTTG ATTGGCTGGA AGCTTGGACG TGTGATCAGC 
GTCATGGACC GCGGCTTTTC CTCTGAAGAG AATTTGCGAA TCTTGCAACA GGCCGGCGGA 
CACTACATTG TCGGCGAAAA AATGCGATCC GGCAAAGCCG CCGTCAAAGA GGCCTTAAGC 
CGTCGCGGAC GTTATCATGA AGTGGACGAG AATTTGCACA TCAAAGAAAT CATCGTCGGC 
GACGGAGAAG CGCGTCAGCG CTATGTTCTC GTGTACAATC CCAGCGAAGC CGAACGCCAA 
CGCAAGGAGC GAGAAAAGCT GCTCGAATCG CTGAAAGAGG AGTTAGAAGG GCTTCGCCAA 
CTCCCAAACG AAGCCCATCA TAAGGCGACC TGCCGGCTGC GTTCCCATCC GTCCTACGGA 
AAATACTTGC GCCAGTTGAA GGACGGAACC CTTCGCATCG ACAAGCAAGC GGTTCGTGAC 
GCGGAAAAGT ACGACGGCAA ATATCTCATC CGGACATCCG ATGACACCTT GTCTGCCGAA 
GATGTCGCCA TCGGGTATAA GCAGCTGGTG GATATTGAGC AGGCCTTCCG AACATTGAAG 
TCTACATTGG AATTGCGACC TATGTATCAT CGCTTGGAAG ACCGCATTCG GGCGCATGTG 
CTGCTCAGTT GGCTGGCTCT CTTGCTGGTT CGGATCGTGG AGATCCGAAC CCATGAATCG 
TGGCCGAAAG TAAGGGATGA ATGTGAGCGT CTTATGCTTG GACATTTTTC TTCCAAAAAC 
GGCGACCTTT ATCAACGAAC CGAACTGACG GCCAAACAGG CTCAATTCTT TGCGGCTCTA 
GGGCTGGAGC CTCCTCCGAA GATCCTAGGC ATCCATCCTC GCGCCTAG

Protein sequence

MYIRRVTRKN KDGTTVAYLQ LAHNEWDPKA KYAKAKVIYS FGREDEVDRA VLERLAKSIS 
RFLSPEQAWE VETLTGEASD DFQFQSCKHL GGVWLLDQLW RQLGLGEILH SLFTSRHHQI 
SLERLIFAMV ANRALHPSSK LAMEEWVEKD VYIPHLPQAA SHQLYRAMDE LLAVQPELER 
QVFHAVADLL NLEVDLIYFD TTSSYFEVDP SETPEGESLR KQGFSKDKRP DLVQIVIGLA 
VTREGVPIRA WVWPGNTMDM TVIKQVKQDL IGWKLGRVIS VMDRGFSSEE NLRILQQAGG 
HYIVGEKMRS GKAAVKEALS RRGRYHEVDE NLHIKEIIVG DGEARQRYVL VYNPSEAERQ 
RKEREKLLES LKEELEGLRQ LPNEAHHKAT CRLRSHPSYG KYLRQLKDGT LRIDKQAVRD 
AEKYDGKYLI RTSDDTLSAE DVAIGYKQLV DIEQAFRTLK STLELRPMYH RLEDRIRAHV 
LLSWLALLLV RIVEIRTHES WPKVRDECER LMLGHFSSKN GDLYQRTELT AKQAQFFAAL 
GLEPPPKILG IHPRA