Gene Htur_1239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_1239
Symbol
ID	8741829
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013743
Strand	-
Start bp	1300161
End bp	1301390
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	55%
IMG OID	646511819
Product	transposase, IS605 OrfB family
Protein accession	YP_003402803
Protein GI	284164524
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTACTA CAGCGAATAA GACGCTCGAA GCGACGCTTG TCTCGCCGAC AGCCCACAAA 
GAGGAGAAGT TACAAGATAC TCTCAAAACA TACCGTGAGG CGCTGCAAGA CGCGTTCGAC 
TCTGGTGCGG ATACGATGAA CGGTGTCTCT GAAGTAGTGA CGCCGTTCGA TCTTCCATAC 
CAAGCGAAGG CTGCACTATG CAGCTACATC CCGAAGCTCC GGAAAACATA TAACGCCCGT 
GAGTTAGACG ATGAACACCC GCTCCGGCTC ACAAATCAGG CCGCGAGGTT CGACTACTCG 
AGCGAACGTG AGCACGAATT CACGTGGTGG GCACCGCGAC CGGGACGAGG GACGAACTTC 
TGGATTCCGC TTCGGATTAA CCCGGAGCAA GAAGACCTCT GGCACGATCT CCTCAACGAG 
GACGTCAAGG CTGGACAGAT TCAACTCCAG AAGAACCGGA AGAACTGGGC ACTTCACGTT 
ACCGTCGAGT ACCCGGTTGA AGAACCGACG GTAGACGGTG ACACCACACC AGTCGGGCTT 
GATATCGGTG AGACTGCGCT GATCACGGCC TGTGGCCTTA AGCGCGGTAC ACCGACAAGA 
CCCGTTCTCT GGAGTGGTAA GCGTACAAAA CACCTCCGAA AGGAAATGTC GACCACGCTT 
CAGCGACTAC AAGAACGTGA TGCTGAATGG CGCATTGATG AACGGTTCGA CTACTACCAA 
AACGCGCTTA CGGATATCCT CGAGAAGGCC AGTTGCGAGG TCGTCGAATA CGCTGGCACT 
TTCGAGAACC CGATGATCGT GATGGAGAAT CTGACGTACA TCCGTGAGAA CTTGGACTAC 
GGGAAGTACA TGAACCGGCG ACTCCACGCG TGGGCCTTTG CACGGCTTCA GGGCCGTGTT 
GAGGACAAAG CGAGAGACGT CGGTATCCCG GTCGAATACG TGAGTCCGCG TTACACGTCT 
CAGACGTGCC ACGAGTGTAG TCACATCGGA AAGCGAAGTA CGCAAGCAGA ACTTCGGTGT 
ACGAACGACC ACTGTCGCGT CTCGACGTTC CAAGCGGATA TCAGTGCAGC TGCAAGCATC 
GCTCAGAGGG TTGACCCGTG GGGAGAGAGC GTTCCTTGGA AATCGGAACG CAATGACTCG 
CCTCGGGATG GGAGCGGTAG TGACACCGCC GTAAGACCAC CCAAGCCGAG CACACCTACG 
CAAATGACGC TTGGAGATGA TCGGTCTTAA

Protein sequence

MSTTANKTLE ATLVSPTAHK EEKLQDTLKT YREALQDAFD SGADTMNGVS EVVTPFDLPY 
QAKAALCSYI PKLRKTYNAR ELDDEHPLRL TNQAARFDYS SEREHEFTWW APRPGRGTNF 
WIPLRINPEQ EDLWHDLLNE DVKAGQIQLQ KNRKNWALHV TVEYPVEEPT VDGDTTPVGL 
DIGETALITA CGLKRGTPTR PVLWSGKRTK HLRKEMSTTL QRLQERDAEW RIDERFDYYQ 
NALTDILEKA SCEVVEYAGT FENPMIVMEN LTYIRENLDY GKYMNRRLHA WAFARLQGRV 
EDKARDVGIP VEYVSPRYTS QTCHECSHIG KRSTQAELRC TNDHCRVSTF QADISAAASI 
AQRVDPWGES VPWKSERNDS PRDGSGSDTA VRPPKPSTPT QMTLGDDRS