Gene Htur_0114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_0114
Symbol
ID	8740677
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013743
Strand	-
Start bp	123865
End bp	124863
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	62%
IMG OID	646510677
Product	TRAP transporter solute receptor, TAXI family
Protein accession	YP_003401688
Protein GI	284163409
COG category	[R] General function prediction only
COG ID	[COG2358] TRAP-type uncharacterized transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence [TIGR02122] TRAP transporter solute receptor, TAXI family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTGACA ATCAAAAATG TATAAATAGC TTCGACGGAA TCGCTAACAG TATGAACCAG 
AATATTAATA GACGGACATT CATTGCAGGC ATCGGTGGGA CCGGTATCGC CGCTCTCGCG 
GGCTGTTCCG GCGAGGGGAA TGAGAACCAG CTCGCGTGGC ACTCGGGCGG CACCGACGGA 
ACGTACTATC CGCTTTCGGG CGAGTTCAAG ACGATCGTCG AAGACCAGAC GGACTACTCT 
CTGCAGGTTC AGTCGACCGG TGCGAGCGTC GAGAACGTCA GCAGCCTCAA CAGCGAAGAC 
GCCGAGTTCG CGCTGATTCA GAACGACATC GCCTACTTCG CGGTCAACGG CACCGGGATC 
GAGGAACTCG AGGGCAACGC GATGGAGAAC ATCCGTGGCG TCGCGACGCT GTACCCCGAG 
ACGATCCACG TTATCACGCA GGCCGACTCG GGAATCGACA GTCTCGAAGA CCTCGAAGGC 
GCCTCGGTCA ACACCGGTGA CACCGGGAGC GGGACGCAGG TCAACGCCCT GCAGATCCTC 
GAGACAGCCG GCATCAGCGA GGACGACTTC GACGAACAGA ACGCCGACTT CGGAACGGCG 
GCCGATCAGG TACAGGACGG CGACGTCGAC GCGGCGTTTA CCGTCGGTGG CTGGCCGGTC 
GGCTCCGTCG AGAACCTCGC GACCAACCAA GACATCGAAC TGGTCGAGAT CTCGGGCGAC 
CTGCGCGAAG ACATCATGGC CGACGCCGAG TGGTTCGCCG AGGACACCAT CCCCGGCGGA 
ACCTACGACG GCGTCGACGA CGACGTCGAT ACCGTCTCCG TCCAGGCGAT GATCGCCACC 
CACGAGGGCG TCGACGAGGA GACCGTCGAA GGGGTGACGA CGGCGATCTT CGACAACACC 
GACGAGATCG GCACGAAGTC GGACTTCATC GACGCCGACT CGGCCCAGGA CGGGATGCCG 
ATCGACTTGC ACGCCGGCGC CGAGGCGTAC TTCAACTGA

Protein sequence

MIDNQKCINS FDGIANSMNQ NINRRTFIAG IGGTGIAALA GCSGEGNENQ LAWHSGGTDG 
TYYPLSGEFK TIVEDQTDYS LQVQSTGASV ENVSSLNSED AEFALIQNDI AYFAVNGTGI 
EELEGNAMEN IRGVATLYPE TIHVITQADS GIDSLEDLEG ASVNTGDTGS GTQVNALQIL 
ETAGISEDDF DEQNADFGTA ADQVQDGDVD AAFTVGGWPV GSVENLATNQ DIELVEISGD 
LREDIMADAE WFAEDTIPGG TYDGVDDDVD TVSVQAMIAT HEGVDEETVE GVTTAIFDNT 
DEIGTKSDFI DADSAQDGMP IDLHAGAEAY FN