Gene GWCH70_1962 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_1962
Symbol
ID	7978924
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	-
Start bp	2022161
End bp	2023408
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	36%
IMG OID	644798789
Product	transposase, IS605 OrfB family
Protein accession	YP_002949959
Protein GI	239827335
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.141469
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATTTTT GTATCAAACA ACAGCTAAAT GGTTTGACCA AAGAAGAATA CTTGACTCTT 
CGAGAACTGT GCCATATTGC CAAGAACATG TACAACGTCG GATTGTACAA TGTCAGACAA 
TACTATTTTG AACACAAGGA ATTTCTTAAT TATGAGAAAA ACTATCATCT TGCCAAAACG 
AACGAAAACT ATAAGCTGTT GAACAGCAAC ATGGCACAGC AAATTTTAAA AAAGGTCAAT 
GAAGCCTTTA AATCTTTCTT TGGTTTGATC AGTCTTGCCA AACAAGGAAA ATATGACCAC 
AAGGCTATCA GTATTCCAAA ATATCTTAAA AAAGATGGCT TTCATTCACT GATCATTGGC 
CAGATTCGTA TAGACGGCAA CAAATTCACG ATACCGTATT CTCGCCTATT TAAAAAGACT 
CACAAGCCTA TCACGATAAC GATTCCGCCT GTGTTACTGG ACAAAAAGAT TAAGCAGATT 
GAAATCATTC CTAAACATCA TGCCAGGTTC TTTGAGATTC AGTACAAATA TGAAATGCCT 
GAAGATCAAA GAGAATTAAA TGACCAAAAA GCACTGGCGA TTGATTTAGG AGTGAATAAT 
CTTGCCACTT GTGTCACATC AGACGGCAGA TCGTTCATCA TTGATGGGCG GAGATTAAAA 
AGTATTAATC AATGGTTTAA CAAAGAAAAT GCCAGACTTC AAAGCATAAA AGATAAGCAA 
AAAATCAAAG GTACAACCCG TAAACAAGCT TTGCTTGCTA TGAATCGCAA TAATAAAGTG 
AATGATTATA TCAACAAGAC TTGCCGTTAC ATCATAAACT ACTGTATTGA AAATCAAATT 
GGCAAACTTG TCATTGGCTA TGCTGAAACA TGGCAGCGCA ATATGAATCT AGGAAAAAAG 
ACAAATCAAA ACTTTGTCAA TATTCCTCTC GGTAACATAA AAGAAAAACT AGAGTATCTT 
TGTAAATTTT ACGGCATTGA ATTCTTGAAA CAGGAAGAAT CATATACGTC TCAAGCCAGC 
TTTTTTGACG GCGATGAGAT TCCTGAATAT AATGCCGACA ATCCAAAAGA ATATAAGTTC 
AGCGGCAAAC GTATTAAGCG CGGCTTGTAT CGAACAAAGT CTGGCAAACT AATTAATGCT 
GATGTCAATG GCGCATTAAA CATCTTAAAG AAAAGTAAAG CTGTAGACCT GAGTGTCTTA 
TGCTCTAGCG GCGAAGTGGA CACGCCTCAA AGAATAAGGA TTGCTTGA

Protein sequence

MYFCIKQQLN GLTKEEYLTL RELCHIAKNM YNVGLYNVRQ YYFEHKEFLN YEKNYHLAKT 
NENYKLLNSN MAQQILKKVN EAFKSFFGLI SLAKQGKYDH KAISIPKYLK KDGFHSLIIG 
QIRIDGNKFT IPYSRLFKKT HKPITITIPP VLLDKKIKQI EIIPKHHARF FEIQYKYEMP 
EDQRELNDQK ALAIDLGVNN LATCVTSDGR SFIIDGRRLK SINQWFNKEN ARLQSIKDKQ 
KIKGTTRKQA LLAMNRNNKV NDYINKTCRY IINYCIENQI GKLVIGYAET WQRNMNLGKK 
TNQNFVNIPL GNIKEKLEYL CKFYGIEFLK QEESYTSQAS FFDGDEIPEY NADNPKEYKF 
SGKRIKRGLY RTKSGKLINA DVNGALNILK KSKAVDLSVL CSSGEVDTPQ RIRIA