Gene GWCH70_1403 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_1403
Symbol
ID	7976857
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	-
Start bp	1472996
End bp	1474243
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	36%
IMG OID	644798325
Product	transposase, IS605 OrfB family
Protein accession	YP_002949498
Protein GI	239826874
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0687416
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATTTTT GTATCAAACA ACAGCTAAAT GGTTTGACCA AAGAAGAATA CTTGACTCTT 
CGAGAACTGT GCCATATTGC CAAGAACATG TACAACGTCG GATTGTACAA TGTCAGACAA 
TACTATTTTG AACACAAGGA ATTTCTTAAT TATGAGAAAA ACTATCATCT TGCAAAAACG 
AACGAAAACT ATAAGCTGTT AAACAGCAAC ATGGCACAGC AAATTTTAAA AAAGGTCAAT 
GAAGCCTTTA AATCTTTCTT TGGTTTGATC AGTCTTGCCA AACAAGGAAA ATATGACTAC 
AAGGCTATCA GTATCCCAAA ATATCTTAAA AAAGATGGCT TTCATTCACT AATCATTGGT 
CAAATTCGTA TAGACGGCAA CAAATTCACG ATACCGTATT CTCGCCTATT TAAAAAGACT 
CATAAGCCTA TCACGATAAC GATTCCGCCT GTGTTACTGG ACAAAAAGAT TAAGCAGATT 
GAAATCATTC CTAAACATCA TGCCAGGTTC TTTGAGATTC AGTACAAATA TGAAATGCCT 
GAAGATCAAA GAGAATTAAA TGACCAAAAA GCACTGGCGA TTGATTTAGG AGTGAATAAT 
CTTGCCACTT GTGTCACATC AGACGGCAGA TCGTTCATCA TTGATGGGCG GAGATTAAAA 
AGTATTAATC AATGGTTTAA CAAAGAAAAT GCCAGACTTC AAAGCATAAA AGATAAGCAA 
AAAATCAAAG GCACCACTCG TAAACAGGCT TTGCTTGCTA TGAATCGCAA TAATAAAGTG 
AATGATTATA TCAACAAGAC TTGCCGTTAC ATCATTAACT ACTGTATTGA AAATCAAATT 
GGCAAACTTG TCATTGGCTA TGCGGAAACA TGGCAACGCA ATATGAATCT AGGAAAAAAG 
ACAAATCAAA ACTTTGTCAA TATTCCTCTC GGTAACATAA AAGAAAAACT AGAATATCTT 
TGTGAATTTT ACGGCATTGA ATTCTTGAAA CAGGAAGAAT CCTATACGTC TCAAGCCAGC 
TTTTTTGACG GCGATGAGAT TCCTGAATAT AATGCCGACA ATCCAAAAGA ATATAAGTTC 
AGCGGCAAAC GTATTAAGCG AGGTTTGTAT CGAACAAAGT CTGGCAAACT AATTAATGCT 
GATGTCAATG GCGCATTAAA CATCTTAAAG AAAAGTAAAG CTGTAGACCT GAGTGTCTTA 
TGCTCTAGCG GCGAAGTGGA CACGCCTCAA AGAATAAGGA TTGCTTAA

Protein sequence

MYFCIKQQLN GLTKEEYLTL RELCHIAKNM YNVGLYNVRQ YYFEHKEFLN YEKNYHLAKT 
NENYKLLNSN MAQQILKKVN EAFKSFFGLI SLAKQGKYDY KAISIPKYLK KDGFHSLIIG 
QIRIDGNKFT IPYSRLFKKT HKPITITIPP VLLDKKIKQI EIIPKHHARF FEIQYKYEMP 
EDQRELNDQK ALAIDLGVNN LATCVTSDGR SFIIDGRRLK SINQWFNKEN ARLQSIKDKQ 
KIKGTTRKQA LLAMNRNNKV NDYINKTCRY IINYCIENQI GKLVIGYAET WQRNMNLGKK 
TNQNFVNIPL GNIKEKLEYL CEFYGIEFLK QEESYTSQAS FFDGDEIPEY NADNPKEYKF 
SGKRIKRGLY RTKSGKLINA DVNGALNILK KSKAVDLSVL CSSGEVDTPQ RIRIA