Gene Htur_3868 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_3868
Symbol
ID	8744496
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013744
Strand	-
Start bp	97101
End bp	98987
Gene Length	1887 bp
Protein Length	628 aa
Translation table	11
GC content	70%
IMG OID	646514453
Product	Heparinase II/III family protein
Protein accession	YP_003405400
Protein GI	284167122
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.103442
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGACGG CGCACGACCA CGACTATCCG CCGCGCGAAT GGACGGTCGG CGGCCTCCGA 
GACGCCCTCG ACGGCCCCGG GGAGGCGTTC ACGCTCCCGA CGTACGACGA CGAAGCGGCG 
TGGACGGCCC TCCGCACGGA CGAACTGACC TGCGAGCCGG TCGAGGCGCT GCTCGACGAC 
GCCGAATCGG CTCGCGACGG CGAGATCCCG TCGCTCACGG CCAGTCAGTA CCTCGACTAC 
GAGCGCACGG GAGATCGGTC GCGCTACGAA GCCGCCGCAC GCGAACGCCG GCGTCGTCTC 
TCCGCGCTCG TCGTCGCCGC GTGCGTCGAA CGCGACGACG ACTTCGATCC GATTTTGGAC 
CACGCGTGGG CGCTCTGCGA GCAGGCGACG TGGACGTGGC CCGCACACCT CGGAGACGAA 
TCTCGGGAGG GGCTCCCGGG CGCCGTCCCG AGCGAAGAGC GGACGGTCGC GCTCTTCACC 
GTCGGCGCGG CGCTCCTCCT CGCGGAGGTC GACGCGATTC TCGGCGACCG TCTCCATCCC 
GCGCTCCGTG AGCGCATCCG CGCCGAAGTC GATTGTCGCG TTTTCACTCC TTACGAGGAC 
CGCGACGACA TTTGGTGGAC GACGGCAACG AACAACTGGA ACGCGGTCTG TAGCGCGGGC 
GTCGCGCTCG CCGCGCTACA CCTCCTCGAC GACGCCGGCC GGCAGGCGCG CATCGTCGAA 
CGCGTCGCCG ACGGTCTCGG CCACTACCTC GACGGCTTCG GCGCCGACGG CGGGACGACG 
GAAGGAGTCG GCTACTGGAA TTACGGCGTG GGCAACTACG TCGCGCTCGC GGACGCCCTC 
GAGAGCGCGA CCGACGGCTC GCACTCGCTG TGCTCGCCCC CGAAACTCGA GCGTCTCGCC 
GCGTACCCAC TCGCCGTCGA ACTCAGCCCC GGACGCTTCG TTCCGTTCTC GGACTCGGAC 
GAGGAGAGCG TCGTCGCGCC GCGCGCGGCC GCGTGGCTCG GACGCCGCCT AGAGAAGCCG 
GGACTGGCGG CTCGCGGCCG GTGGGAGATG GCGCGCCGCA CGGACGCGTT CGCCGGCCCG 
AACGTCGCGT CGCTGCCCGA GATCGTCCGC GACCTCCACT GGACGCGGAC GGTACCCGCG 
TCGTGGACGC GTTCCACCCC GCCGACCCGT CGATACTTCG GGGGCTGTGA GTGGTGGATT 
ACGCGGGCGA GCCCGGCCGA TCCGGACGGT CTCGTCGTCG CCGCGAAAGC CGGCCACAAC 
GGCGAGTCGC ACAACCACAA CGACTGCGGC TCGTTCGTCG TTCACGCGAA CGGCGAGTCG 
CTCCTCACCG ATCCGGGGCG TCCCGAGTAC GACCGGGACT ACTTCGGTCC GGCCCGCTAC 
GAGTACATCA CCGCGCGCTC GCTCGGCCAC TCCGTTCCGT ACGTGAACGG CGTCGAGCAG 
ACCGCCGGGG AGGCGTTCGC CGCGTCGGTA CTCGACCGAC GCTCCTCGCC GACGGTCGAC 
GCGTTCGAGA TGGAACTCGC CGACTGCTAC CCCGAGGACG CCGGTCTCGA GTCGCTCCGC 
CGGACCGTAA CGCTCGACCG AACCGACGGC GTCGTCACGG TCGGCGACGA CGCGGTGTTC 
GCGAACGCGG ACAATACGTT CGAGTCCACG CTCGTCTCCG CGTTCCCGAT TCGAAGCGAC 
GAGCGAGGAC TCGTCGTCGA CGGCGAACGC GGTCGTACGC GGGTGACGCC GGACGATTCG 
GACGCCGAAC GCAGCGTCGA ACGGCTTACG GACGCGATCG AGACGGCCGA CGGGACGCGC 
GACGTCTGGC GCGCTCGCAT CGAACGGACC GTCAGTAGCC GCGCGACGTC GCTACAGCTA 
CGGATCGAAC CCGAGAGCAG AGAGTAA

Protein sequence

MPTAHDHDYP PREWTVGGLR DALDGPGEAF TLPTYDDEAA WTALRTDELT CEPVEALLDD 
AESARDGEIP SLTASQYLDY ERTGDRSRYE AAARERRRRL SALVVAACVE RDDDFDPILD 
HAWALCEQAT WTWPAHLGDE SREGLPGAVP SEERTVALFT VGAALLLAEV DAILGDRLHP 
ALRERIRAEV DCRVFTPYED RDDIWWTTAT NNWNAVCSAG VALAALHLLD DAGRQARIVE 
RVADGLGHYL DGFGADGGTT EGVGYWNYGV GNYVALADAL ESATDGSHSL CSPPKLERLA 
AYPLAVELSP GRFVPFSDSD EESVVAPRAA AWLGRRLEKP GLAARGRWEM ARRTDAFAGP 
NVASLPEIVR DLHWTRTVPA SWTRSTPPTR RYFGGCEWWI TRASPADPDG LVVAAKAGHN 
GESHNHNDCG SFVVHANGES LLTDPGRPEY DRDYFGPARY EYITARSLGH SVPYVNGVEQ 
TAGEAFAASV LDRRSSPTVD AFEMELADCY PEDAGLESLR RTVTLDRTDG VVTVGDDAVF 
ANADNTFEST LVSAFPIRSD ERGLVVDGER GRTRVTPDDS DAERSVERLT DAIETADGTR 
DVWRARIERT VSSRATSLQL RIEPESRE