Gene Hlac_1149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1149
Symbol
ID	7400958
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1156156
End bp	1157484
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	66%
IMG OID	643708214
Product	Extracellular ligand-binding receptor
Protein accession	YP_002565813
Protein GI	222479576
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACCAA ATAGCATGGA CTTGGTCGAC CGGAGAACGC TGCTGAAACT GACGGGAGGA 
GCGGGCGTTG GCGCGCTCGC GGGCTGTCTC AGCACGACCG ACGACGGCGA AGACGGATCC 
GACGGGAGCG ACGGGAGCGA CGGGAGTGAC GGGAGCGATG GCGAGAACGG AACCGACGGC 
GACGACGGGA GCGACGACGG AGGAGACTCG ACCGACGCCT ACGAGATCGG GATGGTCGAC 
TCGCAGACCG GGTCGCTGTC GGCGTTCGGC GAGCGGAACC AGCGCGGCGT CAACCTCGCC 
TTACAGCGCG TCAACGAGAT CGGCATCGAC GGCCGCGACC TCGAGATCAT CGTCGAAGAC 
TCCGAGAGCG AGAACCAAGG CGGGATCGCC GCCGCCCAGA AGCTCGTCAA CCAGGACGGC 
GTGCCCTTCC TCATCGGCGC AGTCGGCTCC GGCGTCTCGC TGGCAATCTA CGAGAGCGTC 
GTGGAGGGGA CGGACGTCGT CCAGCTAAGC CAGAACTCCA CGGGGCTCAA CCTCACGGAT 
TTCCCGGGGC TGCTCCGGAT GTCACCGTCG GGCCGCAGCC AGTCGCTCGC GCTGTCGAAC 
CTCATCACTG ACGACGGCTA CGACGAGGTG GCGATCACCT ACGTCAACAA CGACTACGGC 
CAGAGCCTCA CCGACGCGTT CGTCGACGCG TACGACGGCG AGGTCGTCTA CAACAGCCCG 
CACGACCAGG AGCAGCAGTC CTACTCGGGA GTCATCTCCG AGATGAACAG CTCGGGCGCC 
GACGCGTGGC TGTTCATCAC CTACCAGGCC GAGTTCGCGA CGATGGTCAA CGAGGTGTAC 
TCGTCGGGCT ACGAGGCGCA GTTCTACGGC GCCGACTCCG TCTCCGGCGA CAACGTCCTC 
GAGAACACGC CGGAGGGAAG TATCGACGGC ATGAAGATCG TGGTCCCCTC CGCGCCGATC 
GAGGAGGAGA ACTACCAGTC GTTCGCGTCG GACTTCGAGG AAGAGTACGG CCGGCAGCCG 
ACCTCGTGGG CCGCGTACGC GTACGACTGC GCGATCAACG CCGCGCTCGC GATCCAGGCC 
GCCGACGAGT TCACCGGCGC GGCGCTTCAG GAGACCGTCC GGCGTGTCTC CGGCCCCGAA 
GGGGAGGAAG CGACCTCCTT CGAGGCCGCC AGCCAGATCC TCGCAGACGG CGGCGGTCCC 
GACGACGTCG ATTACCAAGG GGTCAGCGGT CCCATCGACT TCGACGAGAA CGGGGACCCG 
GTCGGTTTCC TTCAGGTCTT GGAGGTCCAA GACCACGCGT ACGAAGGTAT CGACTTCATC 
GAAGGCTGA

Protein sequence

MSPNSMDLVD RRTLLKLTGG AGVGALAGCL STTDDGEDGS DGSDGSDGSD GSDGENGTDG 
DDGSDDGGDS TDAYEIGMVD SQTGSLSAFG ERNQRGVNLA LQRVNEIGID GRDLEIIVED 
SESENQGGIA AAQKLVNQDG VPFLIGAVGS GVSLAIYESV VEGTDVVQLS QNSTGLNLTD 
FPGLLRMSPS GRSQSLALSN LITDDGYDEV AITYVNNDYG QSLTDAFVDA YDGEVVYNSP 
HDQEQQSYSG VISEMNSSGA DAWLFITYQA EFATMVNEVY SSGYEAQFYG ADSVSGDNVL 
ENTPEGSIDG MKIVVPSAPI EEENYQSFAS DFEEEYGRQP TSWAAYAYDC AINAALAIQA 
ADEFTGAALQ ETVRRVSGPE GEEATSFEAA SQILADGGGP DDVDYQGVSG PIDFDENGDP 
VGFLQVLEVQ DHAYEGIDFI EG