Gene Huta_1046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Huta_1046
Symbol
ID	8383320
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhabdus utahensis DSM 12940
Kingdom	Archaea
Replicon accession	NC_013158
Strand	+
Start bp	1010918
End bp	1012114
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	68%
IMG OID	644972111
Product	major facilitator superfamily MFS_1
Protein accession	YP_003129962
Protein GI	257052129
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGAGC GGACGCGGCT CGCGGTGGTC GTCTGGGCAG TGCTGGTCTC GCAGGTACTG 
CTCTACCCTG GCCTCGAAGA CACCGTGATC GCACTGGGTG GCGGCGACCA CCTCCTCGCC 
GGAACCTGGT TTCTCGTTGC GGAGTTCGGA GCCTTCGTCG GGATGGCCGT CCTCTGGGGA 
TTGCTCAGTG ACGCACTCGG TCGACGGACG CCACTGGTCG TCGCCGGGGC GGCCGGTGGA 
GCGGTGAGTT ACCTCGCCGT CGCGGCGGTA CCAGGTCTCG GCGGTAGCTT CGACGTGGTG 
CTCGTGCTAC GGGTGATCGG CGGCGGGTTC ACGATCGGGG CGTTCTCGTT GTCGATCACG 
AAGCTGATGG ATCTCGCCGG AGGGCACGGC AGAAACATGG GAGCAGCGGG GACGGCGATC 
GGCTTCGGCG CGGCGCTTGG CTCGATCGTC GGCGGGGGAC TCGCGACGCT GGATCCGCTC 
GCCCCACTCT ACGCCGGGGC AGTTGTCCTC GCAGGGGCGG CACTGCTGGC AGCGACGGTC 
CCGGACCGGG GCGTCGGCGG TGGGCTAGCC CTCGAGACCG TCTTCGCTCG CATCCGTACC 
CGTCCAGCAC TGCTCGTCCC CTACGCGTTC GGGTACATCG ACCGCCTGAC AGCCGGCTTC 
TTCGCGCTGG CCGGCGTAGC GTACTTCCGT GACGCCTTCG ACGTTGGGCC CGCACTGGCC 
GGGGTGACAC TCGCGCTGTT TTTCCTCCCG TTCGCCGCGC TCCAGTACCC GATGGGGAAC 
CTCTCGGATC GGATCGGCCG GTTCGTGCCC GTCGTCGCCG GATCGCTCTG TTACGGAGTG 
GCGATTATCG CTGTCGGGCT CGCCCCGGTG TACGCACTCG CCGCGCTCCT CATGGTCGTC 
GTCGGCATCT GTGGCGCGGC GGTCTCACCG GCAACGATGG CGCTCGTGAC TGACCTCGTT 
CCGGCGAGCG AACGCGGCGC GGCCATGGGC GGGTTCAACG TCTTTGGCAG TCTAGGCATG 
CTGACCGGCT TCCTCCTCGG TGGCGTCGTT TCCGGCGTCT TTGGCTATCT CCCGGCGTTC 
GTCGCGGTCG GCGGCCTCGA AATTGCGATC GCCCTGCTCG CGGCACGGGC CGTCTTTCGA 
ATGACGGCCG GCCAGCCGGG CGCTGAATGG TTTCGACATG CGATTCGGGA TGGATGA

Protein sequence

MTERTRLAVV VWAVLVSQVL LYPGLEDTVI ALGGGDHLLA GTWFLVAEFG AFVGMAVLWG 
LLSDALGRRT PLVVAGAAGG AVSYLAVAAV PGLGGSFDVV LVLRVIGGGF TIGAFSLSIT 
KLMDLAGGHG RNMGAAGTAI GFGAALGSIV GGGLATLDPL APLYAGAVVL AGAALLAATV 
PDRGVGGGLA LETVFARIRT RPALLVPYAF GYIDRLTAGF FALAGVAYFR DAFDVGPALA 
GVTLALFFLP FAALQYPMGN LSDRIGRFVP VVAGSLCYGV AIIAVGLAPV YALAALLMVV 
VGICGAAVSP ATMALVTDLV PASERGAAMG GFNVFGSLGM LTGFLLGGVV SGVFGYLPAF 
VAVGGLEIAI ALLAARAVFR MTAGQPGAEW FRHAIRDG