Gene GYMC61_0202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GYMC61_0202
Symbol
ID	8524008
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. Y412MC61
Kingdom	Bacteria
Replicon accession	NC_013411
Strand	-
Start bp	210168
End bp	211355
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	53%
IMG OID
Product	transposase IS4 family protein
Protein accession	YP_003251383
Protein GI	261417701
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAGAT TAGCACATCA CCAAGGAATC CACAAGTTTT TCTTCACTTT GGGGTTGACG 
CTGCAGCTTT CCAAACCGGT CATCAAGCAT CTCATTCATA TCGTCGATGC CTTGACCACC 
AAGGGATTCT CGGGAACATT GACCGATATT CATCACTGGA GCTTTCATCC GAATCATCGA 
ACGACGCTCA GTCACTTTTT CACGAAAAGC CCTTGGGATG AGGAAAGGCT GCTTGGGAAG 
CTTCAAGAGT GGATCCTCCG CCGAATCGAG CGCCTGGTCG AGCGAAAGAA TCAGCCTCTT 
TTTGTCTCGA TTGATGATAC GATTTGCCAA AAAACGAAGC CTTCGTCACG GGCAACGCAC 
GCCATTCAAG GGTGCGACTG GCACTACTCG CATAAAGATC ATCAATCGGT TTGGGGGCAT 
TCGCTCGTTT GGCTGATGGT GCACACCTTG ACACAAGCGT TTCCGTTTGC GTTCCGCCTG 
TATGACAAGA AAGCGGGAAA AAGCAAGATC GACCTGGCCA TCGAGATGCT TTCTTCGCTC 
AAAGTGAAGC GGGCTCAGCC GGTGTATGTG CTCATGGATT CGTGGTATCC GTCCAAAAAG 
CTCATTGAAG CCTGCTTGAA ACAGGGATTC CATGTCATCG CCATGCTCAA GACGAACCGG 
ATTCTCTACC CGAAAGGCAT CGCCATCCAA GCCAAGCAGT TCGCCCGCTA TGTCGAGTCC 
GAAGACACCC GCCTCGTCAC GGTGGGGAAG GAGCGTTACC GCGTGTATCG CTATGAGGGG 
GCGATCCATG GCCTCGATGA CGCGGTGGTG CTGCTGGCTT GGAAGGCGGA TCAGCCGATG 
GCGCCGGAAC ATCTCCATGT CGTCTTGAGC ACCGATCGGG AGCTGAGCGA CGAAGACATC 
TTGCGTTACT ATGCTCAGCG TTGGACGATC GAGTGCTTTT TCCGGCAGGC GAAAGATCAA 
CTGAAGCTTG ATGGATACCG CGTTCGCCAC ATTCGGGCGG TGAAACGGTA TTGGGCGGTG 
GTGCTGTTGG CCTGCGTGTA TAGCATCGCC GAATCCCGAC AAAACCTCTC CGCCGGGCTG 
GAGCTTCTTC GGTCGCGGAA AGACCACAGC GTCGTCGAGT TCATTTATGA CGCTGCGAAG 
CAAGATATTC CCATTGATGT GATCAAAAAA CAGCTCCGTA TCGCGTAA

Protein sequence

MNRLAHHQGI HKFFFTLGLT LQLSKPVIKH LIHIVDALTT KGFSGTLTDI HHWSFHPNHR 
TTLSHFFTKS PWDEERLLGK LQEWILRRIE RLVERKNQPL FVSIDDTICQ KTKPSSRATH 
AIQGCDWHYS HKDHQSVWGH SLVWLMVHTL TQAFPFAFRL YDKKAGKSKI DLAIEMLSSL 
KVKRAQPVYV LMDSWYPSKK LIEACLKQGF HVIAMLKTNR ILYPKGIAIQ AKQFARYVES 
EDTRLVTVGK ERYRVYRYEG AIHGLDDAVV LLAWKADQPM APEHLHVVLS TDRELSDEDI 
LRYYAQRWTI ECFFRQAKDQ LKLDGYRVRH IRAVKRYWAV VLLACVYSIA ESRQNLSAGL 
ELLRSRKDHS VVEFIYDAAK QDIPIDVIKK QLRIA