Gene GWCH70_0221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_0221
Symbol
ID	7977977
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	+
Start bp	246135
End bp	247382
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	36%
IMG OID	644797215
Product	transposase, IS605 OrfB family
Protein accession	YP_002948418
Protein GI	239825794
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATTTTT GTATCAAACA ACAGCTAAAT GGTTTGACCA AAGAAGAATA CTTGACTCTT 
CGAGAACTGT GCCATATTGC CAAGAACATG TACAACGTCG GATTGTACAA TGTCAGACAA 
TACTATTTTG AACACAAGGA ATTTCTTAAT TATGAGAAAA ACTATCATCT TGCCAAAACG 
AACGAAAACT ATAAGCTGTT AAACAGCAAC ATGGCACAGC AAATTTTAAA AAAGGTTAAT 
GAGGCTTTTA AATCTTTCTT TGGCTTAGTA AAACTAGCCA AACAAGGCAA ATATGACTAC 
AAGGCTATCA GTATCCCAAA ATATCTTAAA AAAGATGGCT TTCATTCACT GATCATTGGC 
CAGATTCGTA TAGACGGCAA CAAATTCACG ATACCGTATT CTCGCCTATT TAAAAAGACT 
CATAAGCCTA TCACGATAAC GATTCCGCCT GTGTTACTGG ACAAAAAGAT TAAGCAGATT 
GAAATCATTC CTAAACATCA TGCCAGGTTC TTTGAGATTC AGTACAAATA TGAAATGCCT 
GAAGATCAAA GAGAATTAAA TGACCAAAAA GCACTGGCGA TTGATTTAGG AGTGAATAAT 
CTTGCCACTT GTGTCACATC AGACGGCAGA TCGTTCATCA TTGATGGGCG GAGATTAAAA 
AGTATTAATC AATGGTTTAA CAAAGAAAAT GCCAGACTTC AAAGCATAAA AGATAAGCAA 
AAAATCAAAG GCACCACTCG TAAACAGGCT TTGCTTGCTA TGAATCGCAA TAATAAAGTG 
AATGATTATA TCAACAAGAC TTGCCGTTAC ATCATTAACT ACTGTATTGA AAATCAAATT 
GGCAAACTTG TCATTGGCTA TGCGGAAACA TGGCAACGCA ATATGAATCT AGGAAAAAAG 
ACAAATCAAA ACTTTGTCAA TATTCCTCTC GGTAATATAA AAGAAAAACT AGAATATCTT 
TGTAAATTTT ACGGCATTGA ATTCTTGAAA CAGGAAGAAT CATATACGTC TCAAGCCAGC 
TTTTTTGACG GCGATGAGAT TCCTGAATAT AATGCCGACA ATCCAAAAGA ATATAAGTTC 
AGCGGCAAAC GTATTAAGCG CGGCTTGTAT CGAACAAAGT CTGGCAAACT AATTAATGCT 
GATGTCAATG GCGCATTAAA CATCTTAAAG AAAAGTAAAG CTGTAGACCT GAGTGTCTTA 
TGCTCTAGCG GCGAAGTGGA CACGCCTCAA AGAATAAGGA TTGCTTGA

Protein sequence

MYFCIKQQLN GLTKEEYLTL RELCHIAKNM YNVGLYNVRQ YYFEHKEFLN YEKNYHLAKT 
NENYKLLNSN MAQQILKKVN EAFKSFFGLV KLAKQGKYDY KAISIPKYLK KDGFHSLIIG 
QIRIDGNKFT IPYSRLFKKT HKPITITIPP VLLDKKIKQI EIIPKHHARF FEIQYKYEMP 
EDQRELNDQK ALAIDLGVNN LATCVTSDGR SFIIDGRRLK SINQWFNKEN ARLQSIKDKQ 
KIKGTTRKQA LLAMNRNNKV NDYINKTCRY IINYCIENQI GKLVIGYAET WQRNMNLGKK 
TNQNFVNIPL GNIKEKLEYL CKFYGIEFLK QEESYTSQAS FFDGDEIPEY NADNPKEYKF 
SGKRIKRGLY RTKSGKLINA DVNGALNILK KSKAVDLSVL CSSGEVDTPQ RIRIA