Gene Hlac_1999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1999
Symbol
ID	7402018
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	1993410
End bp	1994615
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	67%
IMG OID	643709070
Product	phosphate transporter
Protein accession	YP_002566647
Protein GI	222480410
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0306] Phosphate/sulphate permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.529534
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.207123
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCGGGAG CTGTCTTCTG GGCGCTCGTT GCGCTGGCGA CACTCACCAG CCTCGCCACG 
GCGTGGGCGC TCGGTGCCAA CAGCAACTCG CCGCCGTTTG CCCCGGCGAT CGGTGCCAAC 
GCCATCTCCA CGATGCGAGC GGCCTTCCTC ATCGGCATCC TCGCTGCGCT CGGCGCGCTC 
ACTCAGGGCG GAGCGATTTC CGAGACGGTT GGGGCGGGAC TCATCAACGG CGTCCAAATA 
ACGTCGCTGG CGGCGACGGC GGGACTGCTG ACCGCGACCG GATTCATGGC CTTCGGCGTC 
TACACCGGCT ATCCCGTCCC GGCCGCGTTT GCGACGACGG GGGCGATGGT CGGCGTCGGG 
CTCTCGCTCG GCGGCGACCC CGCCATCGAC ACCTACCGCC GCATCGCGCT CTTTTGGGCG 
CTCGTCCCCC CCGTTTCGGG CGGGCTCGCC TATCTCACTG CCACTATCCT CCGACGCGAC 
GACATCCCGG AGACGATCGG CGTCCCGTTG CTTGCGGCAG TCGTCGGCGG TATCATCGCC 
AACGTCCAAC TGGGCGTTAT CCCCTCGCCG CCCGAGGCGA GCCAAAGTTC CATCGCAGAG 
TTCATTGCGC GACAGGTCGA GTTGCCGACG GTCGCCGATG TCGATCCCGT AGTGGTTCTC 
GTCACGCTCG CGGCCGCCGC GGCGTGGTTT CTGCTGATTC GCCGGCGGAC CAATGCCTCG 
GTCGAGGGGG GCATCCGGAC GTTCCTCATC GTCCTCGGGA GCGTCGTCGC CTTCTCCAGC 
GGCGGCAGTC AGGTCGGGTT GGCGACCGGC CCGCTTGAGA ACCTCTACGG GGCCGAACTC 
GGACTACCCA GTATCGTCCT GCTCGCGCTC GGCGCAACCG GCATTCTCGC GGGTGCGTGG 
ATGGGGGCGC CCAAACTGCT CCAAGCGACT TCCCGTGAGT ACGCACAGTT GGGTGTCAGG 
CGCTCTATCG CCGCGCTGGT TCCCGGGTTC ATCATCGCAC AACTGGCCAT CGCGCTCGGG 
ATTCCGATCT CGTTCAACAA CATCATCATC TCCGGCGTCA TCGGCGGTGG GCTCGCTGGC 
GGCTCAGCGG GCGTGTCTCG TCGGAAGATC GGCGTTACCC TCGTATTCTG GCTCATCACG 
CTCGGTGCCT CTATCGGGAT CGGATTCGGA CTCTACAAGG TCTTTGCCGC GGTGCTCGGC 
GGGTGA

Protein sequence

MAGAVFWALV ALATLTSLAT AWALGANSNS PPFAPAIGAN AISTMRAAFL IGILAALGAL 
TQGGAISETV GAGLINGVQI TSLAATAGLL TATGFMAFGV YTGYPVPAAF ATTGAMVGVG 
LSLGGDPAID TYRRIALFWA LVPPVSGGLA YLTATILRRD DIPETIGVPL LAAVVGGIIA 
NVQLGVIPSP PEASQSSIAE FIARQVELPT VADVDPVVVL VTLAAAAAWF LLIRRRTNAS 
VEGGIRTFLI VLGSVVAFSS GGSQVGLATG PLENLYGAEL GLPSIVLLAL GATGILAGAW 
MGAPKLLQAT SREYAQLGVR RSIAALVPGF IIAQLAIALG IPISFNNIII SGVIGGGLAG 
GSAGVSRRKI GVTLVFWLIT LGASIGIGFG LYKVFAAVLG G