Gene Hlac_0251 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0251
Symbol
ID	7401177
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	271562
End bp	272581
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	66%
IMG OID	643707314
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_002564926
Protein GI	222478689
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0601] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCTAG GACGGTTCCT CCTGAAACGC GGGATCCAAG GCGTGCTGGT CGTGTGGGGG 
GTCGTGACCG CGGTGTTCCT GCTGCGGTTC ATCACCCCCG GCAACCCAGT GACGTTCGTC 
GCACCGCTGG ACGCGAGCGC GGAGCTTCGC GCGCAGATAG CCGCAGATCT GGGGCTCGAT 
CAGCCGCTGT ACATCCAGTA CGTCGACTAT ATCGGCGGGC TCCTACAGGG AGACATGGGG 
TACTCGTACC TCCGCGGGAC TGAGGCGAGC ACCATCGTGT TCGCCCGCGT GCCGGCCACC 
GTCGAGCTGG CGGTCGCGGC GACCATCGTT GCGATCGTCA TCGCGATCCC GCTCGGCGTC 
ATCAGCGCGA CGCGCCGGCG CGAGCCCGCC GACTACGGGG CGACCCTGTT CTCGCTCGTG 
GGCATCTCGA CACCGAACTT CTGGCTCGGG ATCATGCTCA TCCTGGTGTT GTCGGTGCAG 
TTCGATCTGT TCCCGACGAG CCGGCGGCCG ATCGGTTTCT TCGAGACGTT CACGTTCCTC 
GTCACGGTCG AGAACGGACT CTCCGTCCCG ATGAACGTCG GCGCGTTCCT CGACGGACTG 
CGGACGTGGC TGTGGCACAT CACACTGCCG GCGGTGACGC TCGGCACGTA CTTCACCGCG 
CTCGTCACCC GGCTCACCCG GAGCGGGATG ATCGAGGAGC TCGGACAGCC GTACGTCCGC 
GCGGCGCGTG CGAAGGGGCT CCCGGAGTCG CTGATACAGT ACAAACACGC GCTCCAGAAC 
ACCCTCATCC CGATTGTCAC CGTGTTGGGA CTCCAGCTCG GGACCCTGAT CGGCGGCGCA 
GTGATCACCG AGGCCGTGTT CTCGTGGCCC GGGCTCGGCA CGCTCGTCAT CGATGCGATC 
AACGTCCGCG ACTGGCCGCT GATCCAGGGG TCGCTGATCG TGATCGGGAC CGGGTTCGTG 
CTGATCAACA TCTTCGTCGA CTCGCTGTAC GCGTACCTCA ATCCGCGGGT GGTCCACTGA

Protein sequence

MALGRFLLKR GIQGVLVVWG VVTAVFLLRF ITPGNPVTFV APLDASAELR AQIAADLGLD 
QPLYIQYVDY IGGLLQGDMG YSYLRGTEAS TIVFARVPAT VELAVAATIV AIVIAIPLGV 
ISATRRREPA DYGATLFSLV GISTPNFWLG IMLILVLSVQ FDLFPTSRRP IGFFETFTFL 
VTVENGLSVP MNVGAFLDGL RTWLWHITLP AVTLGTYFTA LVTRLTRSGM IEELGQPYVR 
AARAKGLPES LIQYKHALQN TLIPIVTVLG LQLGTLIGGA VITEAVFSWP GLGTLVIDAI 
NVRDWPLIQG SLIVIGTGFV LINIFVDSLY AYLNPRVVH