Gene Htur_5022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_5022
Symbol
ID	8745828
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013748
Strand	+
Start bp	13327
End bp	14592
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	53%
IMG OID	646515636
Product	hypothetical protein
Protein accession	YP_003406583
Protein GI	284176307
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	0.00965074
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCACTCG GAATGCCGGC ATGGTTAGGC GGCTGGGGCG ACGAGTCCGA CACATTGGAA 
GATCTTGGTT TCTTCGACAC GCATTACGTC GCCAATAGTG GAAAGAAACT CAAAATCGAC 
CCCAGCGTTC TAGACTTTGA CGAAAATCTG GAAGCGAGAC TTTCATCTGA GGGTGTGACG 
ATTTCAGGCT CACGAACACC GACTTTAGAC GAAATCTCGG GCTCTATCGC TGGTGGTGGG 
ACGATTTCCA ACCTCACGGG GACGAATTTG TATATCGACG ATACCGGGAC GCTCAATGCC 
ACTGCAAGTA GCGACTCAAC CGACACGACT CTCAATACAA TCCATCTATC GGATTCAGAC 
GACATTCACA ACGTCATCGA CTCTGCAGCC CCCTACACGC GGATTATCGG CGACAGAGAC 
AACCAACATA CACTCTCAAA GCGGATTGAC ATCACAACTG ACGGCCTGAT TCTACAGGAC 
TGCAACCTCA AACTCGGGGC AAGCGTCAAC GACGACGTCA TCTACGTCCA CGACTGCAAG 
GACGCGAAGG TCCTCAACTG TTTCATCGAC GGAAACTACC AGAACCAAGA CTACACCAAC 
AACGGCGTCA GTAACGGGGT TGAGGTCTCG AACGCGCATA ATATCGAGGT CGGAGACAAC 
GAAGTCGTCC GCGCTGCTGG ACAGGGTATC ACGGCCACTT CGTACCCGCT CGCGCAAAAC 
AATGATTACG GTGGCGACAA GCCGGGTGGC CCGATCTCAA ACATCTATAT CGAGGATAAC 
GAACTCTCGG AGATTCAGAA CGGTGATATC CTTCTCTCCG GCGGCAACGG AGTTGCCGCT 
GAGTACGGTT ATATCACCGG GAACGTTTGT ACGTCGACCC AGCAGGATAT TCTGAACGTC 
ATTGACGGCT TCCAGCACGC GAAAGTCGAG GACAACTACT GTATCGGTGG CGGTGTCGGG 
CTCGCCATCG AACAGCACGG GAGCCGTGGC GTTGACCGGA AGGTCCACGA TGTGACTGTC 
CGGAACAATA CGTTCGAGGT GTCGGGCGCG AACGGCATCG AGTTCGACCA CGACACGTAC 
CCGTTCCGAA ACATCAAGCT CAACGATAAC ACGTTCATTG GGAACAACAC TGGCGTGTAC 
GTCCCCTCGA GTTTCGACCT TGATGGCTTC ATGGTTCGGA ACAATACGTT CGAGAGTTGC 
AGCACGGACA TCAGCATCAA CTCCACAATC TCGAACCAGT CTGTAGGCGA CAACCTGACA 
TGGTGA

Protein sequence

MSLGMPAWLG GWGDESDTLE DLGFFDTHYV ANSGKKLKID PSVLDFDENL EARLSSEGVT 
ISGSRTPTLD EISGSIAGGG TISNLTGTNL YIDDTGTLNA TASSDSTDTT LNTIHLSDSD 
DIHNVIDSAA PYTRIIGDRD NQHTLSKRID ITTDGLILQD CNLKLGASVN DDVIYVHDCK 
DAKVLNCFID GNYQNQDYTN NGVSNGVEVS NAHNIEVGDN EVVRAAGQGI TATSYPLAQN 
NDYGGDKPGG PISNIYIEDN ELSEIQNGDI LLSGGNGVAA EYGYITGNVC TSTQQDILNV 
IDGFQHAKVE DNYCIGGGVG LAIEQHGSRG VDRKVHDVTV RNNTFEVSGA NGIEFDHDTY 
PFRNIKLNDN TFIGNNTGVY VPSSFDLDGF MVRNNTFESC STDISINSTI SNQSVGDNLT 
W