Gene Hlac_2149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2149
Symbol
ID	7401082
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	2136945
End bp	2137970
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	68%
IMG OID	643709219
Product	ABC-type nitrate/sulfonate/bicarbonate transport systems protein
Protein accession	YP_002566796
Protein GI	222480559
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACGAGC GAAACGCGGG AGCCTCGCGA CGGTCCTTTC TTGCGGCCGC GGGCGGAGCG 
GCCACGGTCG GTCTCGCCGG CTGTCTCGGC GGCGACGACG GCGGACTCAA CGAACTGACG 
GTCGCACACA TGCCGATCTA CCCCGACCTC CAGTGGTACG TGATGGAGGG CGAGGGCTAC 
TTCTCCGAGA TCGACGCCGA GATCACCGGC CGAGAGTTCA CCGACGGCCC GTCGATCGTG 
CAGGCGATCG GCGGCGGCGA CATCGACGTC GCCATGTTCG GGATCGTGCC GGCGATGATC 
GTCATCGACC GCGACATCCC CGCGCAGGTG ACCGCGGCGA ACATCCGCGA ACCGATGGGG 
ATCATGGCCG AGGAGTCGTT CCACGAGACC TTCGAGGCGG AGGGCGGCGA CGCGTTCGCG 
ACGTGGGCCG AGGAGAACGG CGGGCCCTTC CGGTTCGGCA CCTTCCCGCA GGGCAGCGTC 
CCGGACGTGC TGCTCCGCTA CTGGCTCCAG GAGATCGGCG TCGACCCCGA GTCGAACGAG 
AACGTCGAGA TAATCGAGAT CAACGGCGCG AGCGCCGTCT GGCAGGCGAT CGCCAACGAC 
GAGATCGACG GCACCTCGAT CATGGAGCCG GTGCCAACGA TCGCCCAAGA GGAGGGCTCG 
TCCGTCACGA TGCTCCGGAC GGCCGCGCAG ATCCTCCCCG GCCAGCCCGC GGCGGTCACC 
CTGATGAGCG ACGCGGTCCG CGACTCTCCG CTCGCCGTGC AGTTCGTCGA GCAGCACGTC 
CGTGCCACCG ACTTCATCGA CGAGAACCCG GACGCGACCG CCGGGCACGT CGAGTCGGGG 
ATCGGGATGC CGGCTGACCG CGCCCGCCGG GCGCTCGACT CGCCGCTGTC GAACTTCGTC 
ACTGACCCCC GCGAGATCAC CGAGGCGACC CCGGTCTTCT CGGAGTTCGC GGCGAACAAC 
GGACAGATCG ACGAACAGCT GTCGAACGAG GCGATCTTCG ACTTCGAGGT GTACGACTCG 
CTCTGA

Protein sequence

MYERNAGASR RSFLAAAGGA ATVGLAGCLG GDDGGLNELT VAHMPIYPDL QWYVMEGEGY 
FSEIDAEITG REFTDGPSIV QAIGGGDIDV AMFGIVPAMI VIDRDIPAQV TAANIREPMG 
IMAEESFHET FEAEGGDAFA TWAEENGGPF RFGTFPQGSV PDVLLRYWLQ EIGVDPESNE 
NVEIIEINGA SAVWQAIAND EIDGTSIMEP VPTIAQEEGS SVTMLRTAAQ ILPGQPAAVT 
LMSDAVRDSP LAVQFVEQHV RATDFIDENP DATAGHVESG IGMPADRARR ALDSPLSNFV 
TDPREITEAT PVFSEFAANN GQIDEQLSNE AIFDFEVYDS L