Gene Hlac_0249 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0249
Symbol
ID	7401175
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	269228
End bp	270454
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	67%
IMG OID	643707312
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_002564924
Protein GI	222478687
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGACC TGTTGCGCGT CCGGGACCTC TCGACGCGCT TCTTCACCGA GGAGGGCCAG 
ATTAACGCGG TCGAGAACGT CTCGTTCACC GTCGAGGCGG GATCCGTCCT CGGCGTCGTC 
GGCGAGTCCG GCAGCGGGAA GTCCGTCACC GGGCTCTCGC TCATCGACTT GGTCGAGTCG 
CCGGGGCAGA TTACGAGCGG AGAGATCTGG TACAACAACG CCGACCTCGC AGACCGGATC 
GGCGAGGAGG ATCCCGAGGC GGTCGACGGC GACTTCGTCG ACCTCCGCCG ACTCTCCGAG 
GCGGAGCGCC GGTCGCTCCG CGGGTCTGCG TTCAGTATGA TCTTCCAAGA TCCGATGAGC 
AGCTTCAACC CCTCTATCAC CGTCGGTGAG CAGATCGCCG AGGCGGCCGA GGTGCAGCGC 
CGGGCGAGCG CGAACCCGCG CTCGACCCGG TCGCGGACGC AGGGGTACGG GCTGGGCCAG 
ATGTTCCTCG ACGGCGTCCT CCCCAACCGC TCGTACACCT CCGAGGAGAG CTGGGACCGC 
GCGATCGAGC TGCTCGAACG CGTCGGCATT CCCGACCCGG CCGAGCGCGC CGAAGAATAC 
CCGCACCAGT TCTCCGGTGG GATGCTCCAG CGCGCGATGA TCGCACAGGC GCTCGCCGGC 
GACCCGGATC TGCTCGTGGC CGACGAGCCG ACGACCGCGC TGGACGTGAC CATCCAGGCG 
CAGATCCTCG ATCTGCTCGC CGATCTTCAG GAAACGATGG AGATGAGCGT CGTGCTCATC 
ACCCACAACT TAGGCGTCAT CGCCCGGATC GCCGACCGAG TAAGCGTCAT GTACGCCGGC 
GAGGTGGTCG AACGCGGGAC CCTGCAAGAC GTGTTCGACG ATCCGGTCCA CCCGTATACG 
AAGGGGCTGT TGGGCTCGGT ACCAGACATC GATCGCCCAG ACGATCGGCT CGAACCCATC 
GCGGGCAACG TGCCGGACCT CGTCGACGCG AACATGCCCG ACCGGTGCTA TTTCGCCGAT 
CGCTGTCCGA AAGCCATGAC AGACTGTCTC ACGCGACTGC CGGAGTACGA AGTAACTGAT 
AGCCACCGCG CCCGCTGCGT CCTCGCCGAG CGCGAGTACA GCGAGGCCGA CGCGGTCTCC 
GCCGAGCGGC TCGCGGGGCC GACGGACGAC AGGGCGGCCA CGGATGACGA CTCGGCCGCA 
CACGACGCCC AGGTGAGCAA TGACTGA

Protein sequence

MTDLLRVRDL STRFFTEEGQ INAVENVSFT VEAGSVLGVV GESGSGKSVT GLSLIDLVES 
PGQITSGEIW YNNADLADRI GEEDPEAVDG DFVDLRRLSE AERRSLRGSA FSMIFQDPMS 
SFNPSITVGE QIAEAAEVQR RASANPRSTR SRTQGYGLGQ MFLDGVLPNR SYTSEESWDR 
AIELLERVGI PDPAERAEEY PHQFSGGMLQ RAMIAQALAG DPDLLVADEP TTALDVTIQA 
QILDLLADLQ ETMEMSVVLI THNLGVIARI ADRVSVMYAG EVVERGTLQD VFDDPVHPYT 
KGLLGSVPDI DRPDDRLEPI AGNVPDLVDA NMPDRCYFAD RCPKAMTDCL TRLPEYEVTD 
SHRARCVLAE REYSEADAVS AERLAGPTDD RAATDDDSAA HDAQVSND