Gene Huta_1895 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Huta_1895
Symbol
ID	8384186
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhabdus utahensis DSM 12940
Kingdom	Archaea
Replicon accession	NC_013158
Strand	-
Start bp	1905643
End bp	1906893
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	69%
IMG OID	644972963
Product	major facilitator superfamily MFS_1
Protein accession	YP_003130797
Protein GI	257052964
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2223] Nitrate/nitrite transporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGAGG AGGTCGACCA CGCCGCCCGT GCCCGTGACG TCCTCGGGTT CTCGCGGTGG 
TGGCTGGTGC TCGCGGCCGC GGCCATGATG GCCGTCGTCG GCCCCTACCA GTACGTCTGG 
AGCAGTCTCC GGGATCCAGT CGCGACCAAC CTGGGGATCG ACAGCGCCGC ACTGTCGACG 
GTGTTCACGC TGTTCGTCGT CGTCCAGGCC GGGAGCCAGT TCCCGGTCGG GTGGTGGCGT 
GATCGACACG GTCCCCGCGC GGTGAGTGTC GCCGCGGCTA TCCTCGCCGG CGGCGGCTAC 
CTCGGCCTCT CAGTGGCCGA GACGACCTGG GAGATCTATC TCGCCTATTC GCTGGGAGCC 
CTGGGCGTCG GCATCGTCTA CACCGTCGCC GTCAACACCG CGTTGAAGTG GTTCCCTGAC 
CGGCGTGGAC TCACCGCGGG GGTCGGTACG ATGGCCTTCG CGGGGGGGAG CGCCGCCTTG 
GTCCCCTACG TTCGGGCGAA TACCGGCGCG GGTGCGCCCG TGACGGCATA CGTCGGCGTC 
CTCCAGCAGG TCGGCGTCGT GATCTTCGCG GTCGTGCTCG TCGGTGCGCT GGTCCTCCGG 
GACCCACCCG AGGGATGGCT GTCCGACGGC AGCGTCACCG ACACGGGCCC ACAGTTCACC 
TGGCGGGAAA TGGTCCGAAC CCGGCAGTTC TGGCTCATGT ACGCCATGTT CGTCGCCGTC 
TCTGGGGCCG GCCTCATGCT GACCGAGAAG ATCGTCTCCT ACGCCGACCA CCTGGGACTC 
GCGGGCGTGA TCGCCACGGC AGCCGCGACC CTCCTTCCGC TGGCCGGCGG CATCGGCCGA 
CTCGTGCTGG GTGAGGTCAG CGACCGGGTC GATCGGACCA ACGCGATGGC CGGGGCGTTC 
ACGCTCTGTG GCCTCGGCCT GTTCGCCGTC GCGTACTTCG GCGTCAGCGG GATGGGGAGT 
GCCTTCGTCG TGGCAGTCGT CGTCGCCACC TTCTTCTGGA GCCCGCAGTT CACGCTGTTC 
CCCAGCGTCG TCGGTGACTA CTACGGCGAG AAACACTCGA GTGCGAACTA CGCCCTGCTT 
TACTCCGGGA AGATCTGGGG CGGCGTCTTC GGCGGGACCG TCACGGGTGC CGCCGTCGTC 
GCCGTCGGCT GGACGGAAAC GTTTCTGCTC GGGGGCACAC TGGCCGTCCT GGCAGGTGTG 
GCTGCCCTCG GACTCGACGC GCCGTCGCCA CCTGACGCCG ACAAACGCTG A

Protein sequence

MNEEVDHAAR ARDVLGFSRW WLVLAAAAMM AVVGPYQYVW SSLRDPVATN LGIDSAALST 
VFTLFVVVQA GSQFPVGWWR DRHGPRAVSV AAAILAGGGY LGLSVAETTW EIYLAYSLGA 
LGVGIVYTVA VNTALKWFPD RRGLTAGVGT MAFAGGSAAL VPYVRANTGA GAPVTAYVGV 
LQQVGVVIFA VVLVGALVLR DPPEGWLSDG SVTDTGPQFT WREMVRTRQF WLMYAMFVAV 
SGAGLMLTEK IVSYADHLGL AGVIATAAAT LLPLAGGIGR LVLGEVSDRV DRTNAMAGAF 
TLCGLGLFAV AYFGVSGMGS AFVVAVVVAT FFWSPQFTLF PSVVGDYYGE KHSSANYALL 
YSGKIWGGVF GGTVTGAAVV AVGWTETFLL GGTLAVLAGV AALGLDAPSP PDADKR