Gene Htur_5224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_5224
Symbol
ID	8745772
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013747
Strand	-
Start bp	120273
End bp	121388
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	68%
IMG OID	646515581
Product	hypothetical protein
Protein accession	YP_003406528
Protein GI	284176251
COG category
COG ID
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0997933
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCGTC GGGCCTTTCT CCGTGGTACG GCCGTCGCCG GCACCGCCGC TATCGCCGGC 
TGTCTCGAGC GTCTGGGTTT CGAAGAGGAG TCGGCCTGGG ACAACCCGCC GCTCGTGGAG 
GATCGCCCCG ACGCGGTCTA TCTGCCCGCG GGCAAAGAGG AGATGGGCCA CTACGGTCGC 
GCGAGCGACG GCGAGTACGC CGTCGAACTC TCCTATACGA TCCCCCACCG GTTCTGGACT 
GTCTCCGGCG ACACCCAGCG GGTCGACGTG GACACCGACG ACAGCATGCA CCTCATGCTG 
ACCGTCTGGG ACGAGGAAAC GGACACCATC CTTCCGGTGA ATACCGACCT CGAACTCCAG 
CGTGAGGACG GCGAGGTCGT CGAGCAGCTG ACGCCGTGGT CGATGCTCTC CCAGCGGATG 
GGGACCCACT ACGGCGACAA CGTCACGCTC CCCGAAGAAG GCGCCTACAC CGCCCGCGTC 
CGGGTCGGTC CGGTCACGAC CGACCGAACC GGCGCGTTCG AGGGTCGGTT CGAGGAGACG 
AGCACGCTCG AGGTCGAGTT CGAGTTCGAG CGCTCGGACA TCCACGACCT CGAGTTCAAC 
ATGGTCGACG AGGAGCGGCG GGGCGCCCGC GAGGCCCACA CACTGATGGA CCCCAGTGGA 
CACGACGGGC ACGGGGATGG CGGGCACGGC GACGGCGAAC CCGGACACGC CCCGACATCC 
GACGGGCCGC CGGTCGCGGA GCTTCCCGGC GACCGGCTCG GAACCGAACG CAGCGCGGAC 
GCGAAGATCA CCGCGATCCG GGCGAGCGCC GAACGGGTGG CCGGCGACGG CGACTATCTC 
GTCGTCTGTC CCCGAACGCC GTACAACGAC GTGAGCCTCC CGTCCGCGAC GCTGCGCGCT 
ACGGTCGAGC GCGACGGAAC GACCGTCCTC GAGGGTGAGT CGCTCGCAGA GACGATCGAT 
CCCGAGTTTG GCCACCACTA CGGACTCGAT CTCGAGGCCC TCGAGAGCGG TGACGAACTC 
ACCGTCGCCG TCGACCGACC GCCGCAGGTG GCGCGCCACG ACGGCTACGA AACCGCGTTT 
TTCGACTTCG ACGACGTGCG GTATACCGTG TCCTGA

Protein sequence

MNRRAFLRGT AVAGTAAIAG CLERLGFEEE SAWDNPPLVE DRPDAVYLPA GKEEMGHYGR 
ASDGEYAVEL SYTIPHRFWT VSGDTQRVDV DTDDSMHLML TVWDEETDTI LPVNTDLELQ 
REDGEVVEQL TPWSMLSQRM GTHYGDNVTL PEEGAYTARV RVGPVTTDRT GAFEGRFEET 
STLEVEFEFE RSDIHDLEFN MVDEERRGAR EAHTLMDPSG HDGHGDGGHG DGEPGHAPTS 
DGPPVAELPG DRLGTERSAD AKITAIRASA ERVAGDGDYL VVCPRTPYND VSLPSATLRA 
TVERDGTTVL EGESLAETID PEFGHHYGLD LEALESGDEL TVAVDRPPQV ARHDGYETAF 
FDFDDVRYTV S