Gene Hlac_3454 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_3454
Symbol
ID	7402300
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012030
Strand	-
Start bp	202124
End bp	203047
Gene Length	924 bp
Protein Length	307 aa
Translation table	11
GC content	67%
IMG OID	643709995
Product	molybdate transport protein
Protein accession	YP_002567561
Protein GI	222481325
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG2998] ABC-type tungstate transport system, permease component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGATAC AACGCCGCCA GTTCGTCGTG GCTATCGGCG CCGGGGGAGT CGCGACGGGC 
CTCGCCGGGT GTTCGCAGGT GGTCGGGAGC GACGGCCAGC CGGCGGTGGC GGGTGAAACC 
CTGACGCTCA CGACGACGAC GAGCACCTAC GACACCGGAC TGCTCGACGA CATCCACCCC 
GACTTCGAGG ACATGTACGG GGTGTCCGTC GACGCGGTCG CACAAGGAAC CGGTGCCGCC 
CTCCAGTCCG CGCGCAACGG CGACGCCGAC GTCGTGATGG TCCACGCCCG CGGCCTCGAG 
GACGGGTTCA TGCGCAACGG GCACGGCATC AACCGCCGCG ACCTCATGTT CAACGACTTC 
GTCGTCGTCG GCCCGGAGAG CGACCCGGCA GGCATCGAGG GTTCGAGTTC GGCGACCGAG 
GTGCTCGATG CCATCGCCGA CGCCGAAGCG ACGTTCGTCT CCCGGGGCGA CAACTCGGGA 
ACCCACACGA AAGAGCTCGA CCTCTGGGAC GCCACGGACG CCGAACCGGG CGGGGACTGG 
TACCAGGAGA CCGGGACCGG GATGGGCCAG GCGCTGAACG TCGCGGCCCA GCAGGGCGCG 
TACACGCTCT CCGATCGCGG GACGTTCATC TCCCAGCGCG GCCAGATCGA CCTCGCGATC 
CTGGTACAGG GCCCAATCGA GGGTGGTCCC GAGATCCTCG CGAACCCCTA CGGCATCATG 
GCAGTCAATC CAGGGAAACA CGAGAACGCC AACTACGACC TCGCGATGGC GTACATCGGC 
TGGATAACCA GCCCCGGTGC CCAGGACGCC ATCTCGGGGT ACCAGGTGAA CGGCGAACAG 
TTGTTCTTCC CCGAGGCCGT TTCCGAAGAC CCCAACTTCC AGCAGTACGT CCCCGACGGG 
TGGAGCGACG ACTCCAACGA CTGA

Protein sequence

MPIQRRQFVV AIGAGGVATG LAGCSQVVGS DGQPAVAGET LTLTTTTSTY DTGLLDDIHP 
DFEDMYGVSV DAVAQGTGAA LQSARNGDAD VVMVHARGLE DGFMRNGHGI NRRDLMFNDF 
VVVGPESDPA GIEGSSSATE VLDAIADAEA TFVSRGDNSG THTKELDLWD ATDAEPGGDW 
YQETGTGMGQ ALNVAAQQGA YTLSDRGTFI SQRGQIDLAI LVQGPIEGGP EILANPYGIM 
AVNPGKHENA NYDLAMAYIG WITSPGAQDA ISGYQVNGEQ LFFPEAVSED PNFQQYVPDG 
WSDDSND