Gene Htur_1081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_1081
Symbol
ID	8741669
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013743
Strand	+
Start bp	1130981
End bp	1131958
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	67%
IMG OID	646511660
Product	flap structure-specific endonuclease
Protein accession	YP_003402646
Protein GI	284164367
COG category	[L] Replication, recombination and repair
COG ID	[COG0258] 5'-3' exonuclease (including N-terminal domain of PolI)
TIGRFAM ID	[TIGR03674] flap structure-specific endonuclease

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAAACG CTGCACTCCG CGACATCGCC GTCATCGAGG AGCTCCCCTT CTCCGAGATC 
GAGGGCGTCG TCGCCGTCGA CGCCCACAAC TGGCTCTACC GGTACCTAAC GACGACGGTC 
AAGTGGACGG ACAGCGACGT GTACACGACC GCCGACGGAA CCGAGGTCGC CAACCTCGTC 
GGCATCGTCC AGGGGCTGCC CAAGTTCTTC GAGAACGACA TCACGCCGGT GATGGTCTTC 
GACGGCGGAC CCTCCGAACT CAAGGAAGAC GAGATCGAGT CCCGCCGCGA TCAGCGTCGC 
ACCTACGAGG AGCAACTCGA GGTCGCCCGC GAGGAGGGCG ATCAGGTCGC CATCGCGCAA 
CTCGAGTCCC GGACCCAGCG GCTGACGCCG ACGATTCAGG AGACCAGCCG CGAGCTGCTC 
CGACGGCTCG ACGTCCCGAT CGTCGAGGCG CCCGCGGAGG GCGAGGCCCA GGCCGCGCAC 
ATGGTCCGGC GCGGCGACGC CGACTACGTC GGCTCGGAGG ACTACGACGC CTTGCTGTTC 
GGCTCTCCGC TCACGCTGCG CCAACTGACG AGCAAGGGCG ATCCCGAACT GATGGACCTC 
GAGGCGACCC TCGATCACCA CGACCTCACG TTAGAGCAGC TGATCGACGC GGCGATCCTC 
ATCGGGACGG ACTTCAACGA GGGCGTCTCG GGGATCGGGC CGAAGACCGC TATCAAAGCC 
ATCACCGAAC ACGGCGACCT CTGGAGCGTC CTCGAGGACC GAGGCGCGCA CATCGAGTAC 
GGCGACCGGG TCAGACAGCT GTTCCGCGAC CCCAACGTGA CCGACGACTA CGAGTTCGAC 
ACGGACCTCG ATCCGGACCT CGAGGCCGCC AGGGAGTACG TCTGCGAGGA GTGGCGCGTC 
GACGAAGGCG AAGTCGACCG CGGCTTCGAG CGCATCGAGG AGAGCGTCAC GCAGACGGGG 
CTGGACCGCT GGACCTGA

Protein sequence

MGNAALRDIA VIEELPFSEI EGVVAVDAHN WLYRYLTTTV KWTDSDVYTT ADGTEVANLV 
GIVQGLPKFF ENDITPVMVF DGGPSELKED EIESRRDQRR TYEEQLEVAR EEGDQVAIAQ 
LESRTQRLTP TIQETSRELL RRLDVPIVEA PAEGEAQAAH MVRRGDADYV GSEDYDALLF 
GSPLTLRQLT SKGDPELMDL EATLDHHDLT LEQLIDAAIL IGTDFNEGVS GIGPKTAIKA 
ITEHGDLWSV LEDRGAHIEY GDRVRQLFRD PNVTDDYEFD TDLDPDLEAA REYVCEEWRV 
DEGEVDRGFE RIEESVTQTG LDRWT