Gene Hlac_0331 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0331
Symbol
ID	7399721
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	353992
End bp	355167
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	72%
IMG OID	643707393
Product	phosphate transporter
Protein accession	YP_002565005
Protein GI	222478768
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0306] Phosphate/sulphate permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.799438
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.0469398
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTGTCG TAACTGTCGC CACCCTCGGT GTCGCCGCCG CCGCCAGCCT CTTTATGGCG 
TGGTCGATCG GCGCCGGATC CTCCGGATCG ACACCGTTCT CTCCGGCGGT CGGTGCCAAC 
GCCATCTCCG TGATGCGCGC GGGGCTCGTG GTCGGTGTGT TGGGGTTAAT GGGCGCGATC 
CTCCAGGGCG CGAACGTGAC AGAGGCGGTG GGAACCGAGC TGATCGGCGG CGTCACCCTC 
ACCGCCGGCG CGGCCATCGT CGCGCTGCTC ACTGCGGCCG CGCTCGTCGC GATCGGCGTG 
TTCGCGGGGT ACCCGATCGC GACCGCCTTT ACCGTCACCG GCGCGGTCGT CGGCGTCGGG 
CTCGCGATGG GCGGCGACCC GGCGTGGCCG AAGTACACCG AGATCCTCAC GCTGTGGATC 
CTCACCCCGT TCGTCGGCGG CGGCGTCGCC TACGGCGTCG CGCGGATGCT CATCGGCGAG 
CGGCTTCCCG AGCGAGCGCT CACCGCGGCG CTCGCCGGGC TGGTCGGCGC GATCGTCGCG 
AACGTCGGGT TCGCGCTGCT CGGGCCGGCG GGCCAGCAGG CGTCGCTGTC GGAGGCGTTC 
GGTTCCGGGC TCGGGATCGG CGCGATCGGC ACGCCTCTGG TCACGGTCGC GGTGGCGGCG 
GTCGTCGCGC TCGCGGTGTA CGCCGACCTC GGTCGCGACC GCGAGGGCGC CCAGCGCCGA 
TTCCTCCTCG CGATGGGCGG ACTGGTCGCG TTCTCGGCCG GCGGCTCGCA GGTCGGGCTC 
GCGATCGGCC CGCTCGTCCC GATCTTCAGC GATGTCGGGG TCCCGCTGTG GGCGCTGCTC 
GTCGGCGGCG GCGTGGGACT CCTCGTCGGA TCGTGGACCG GCGCGCCGCG GATGATCAAA 
GCGATCTCGC AGGACTACGC CTCGATGGGG CCGCGGCGGT CGATCTCGGC GCTCATCCCG 
TCGTTCGCGA TCGCGCAGAT CGCGGTCGCG TTCGGGATCC CCGTCTCGTT CAACGAGATC 
ATCGTCTCCG CCATCGTCGG CGCGGGTTAC GCCGCGGGCG ACGCGGGCGT GAGCCGGTCG 
AAGATGGGGT ACACCGTGTT CGCGTGGATC GCGTCGCTCG TCGGGTCGCT GGCGCTCGGG 
TTCGGCGTAT ACTCCGCCGT GCAGTTCGTG CTCTGA

Protein sequence

MVVVTVATLG VAAAASLFMA WSIGAGSSGS TPFSPAVGAN AISVMRAGLV VGVLGLMGAI 
LQGANVTEAV GTELIGGVTL TAGAAIVALL TAAALVAIGV FAGYPIATAF TVTGAVVGVG 
LAMGGDPAWP KYTEILTLWI LTPFVGGGVA YGVARMLIGE RLPERALTAA LAGLVGAIVA 
NVGFALLGPA GQQASLSEAF GSGLGIGAIG TPLVTVAVAA VVALAVYADL GRDREGAQRR 
FLLAMGGLVA FSAGGSQVGL AIGPLVPIFS DVGVPLWALL VGGGVGLLVG SWTGAPRMIK 
AISQDYASMG PRRSISALIP SFAIAQIAVA FGIPVSFNEI IVSAIVGAGY AAGDAGVSRS 
KMGYTVFAWI ASLVGSLALG FGVYSAVQFV L