Gene Huta_0862 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Huta_0862
Symbol
ID	8383135
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhabdus utahensis DSM 12940
Kingdom	Archaea
Replicon accession	NC_013158
Strand	-
Start bp	828509
End bp	829702
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	62%
IMG OID	644971926
Product	extracellular solute-binding protein family 1
Protein accession	YP_003129778
Protein GI	257051945
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATTTACC TCCACCACAT GGCACAGACC GAACCGGCAC AAAAGCGGTT TGAACTCCTG 
CACCAATTAG TGGGGGCTGA GTGGGGCGGG GCGGCGCTGA ACGCGCTCGT TGATGGCTAC 
GAGCGCCGAA CGTCGTATGC CGTCGAGGAG ACGACGACGT CGGCCGACGA TCTCTCTATC 
CGGGTGAAGA TCCGGATCCT TCAGGAACGG GCCCCGGACG CCTGGATCGA ATGGCCGGGC 
CAGCACATCA CGCCGTACAT CGATACCGGT GCAGTCCGTG ACATCACCGA TGTCTGGGAA 
GAGAACGGGC TCGTGGATGC CTTCACCGAG GGGGCCAAAG AACAGGTCCG CTTCGACGGC 
AGTTACTACG CAATCCCGCT GAACATCCAC CGGATCAACA ACCTGTTTTA CAACGTCGAG 
ATGGTCGAGC GAGCCGGTGT CAATATCGAC GTCAACTCAC CGCAAGCGTT CGTCGACGTC 
CTCGAACAAC TCGATGATGC CCTCGACGTC GCGCCGTTCT TGATGGCACT CCGGAACCCC 
TGGGGAGCGA TCCACGTCTG GGAGACGATC GTCCTCGGGG AGACCGATCC CCAGACGTAT 
CGGGACATCA TCAACGGGGA TGCCGACCGC CACCGCGATG CCATCGCGTC GACGCTTTCG 
ATTCTGGCAC GCTATCTGGA ATTCGCCAAC GACGACGCGC AGTTCTCCTC GCTGCCCGAC 
GCCAACGCCC ACTTTGTCGA CGACGAGGGG GCGCTGTTCC TGATGGGCGA CTGGGCTGCC 
AGCGCGTACG ATCAGGACGA CTACGGCGAG ACTTGGGATA CGATCCCGTT CCCGGGGACT 
GCGGGCGAGT ATCCCATCAA CATGGACGCG CTCATCCCGT CGAGTACTGC CGGCGACACG 
ACGGCGATCG ACGAGTTCCT CGCCTACGCC GGCTCCCGCG AGGCACAGAC CGCGTTCAAT 
CGTCACAAAG GTTCGACCCC ACCCCGGACC GACACCGATC GCTCGGAGTT CACGGACTTC 
CTTCAGGATC AGCAGGCGGA CTTCGACGCC GCCACCTCAC AGGTCCCGTC GATGGCCCAC 
GGTCTGGCGG TCCATCCCGA GCAACTCATC GAAGTCAAGT CCACGATGGC GGAGTTCGTC 
TCCGATCCCG ATCCGGCGAC GACCGCCGAC AGACTCGCCG ATATCCTCTC TTGA

Protein sequence

MIYLHHMAQT EPAQKRFELL HQLVGAEWGG AALNALVDGY ERRTSYAVEE TTTSADDLSI 
RVKIRILQER APDAWIEWPG QHITPYIDTG AVRDITDVWE ENGLVDAFTE GAKEQVRFDG 
SYYAIPLNIH RINNLFYNVE MVERAGVNID VNSPQAFVDV LEQLDDALDV APFLMALRNP 
WGAIHVWETI VLGETDPQTY RDIINGDADR HRDAIASTLS ILARYLEFAN DDAQFSSLPD 
ANAHFVDDEG ALFLMGDWAA SAYDQDDYGE TWDTIPFPGT AGEYPINMDA LIPSSTAGDT 
TAIDEFLAYA GSREAQTAFN RHKGSTPPRT DTDRSEFTDF LQDQQADFDA ATSQVPSMAH 
GLAVHPEQLI EVKSTMAEFV SDPDPATTAD RLADILS