Gene Hlac_0065 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0065
Symbol
ID	7401420
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	67238
End bp	68572
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	61%
IMG OID	643707126
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_002564741
Protein GI	222478504
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4608] ABC-type oligopeptide transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0310035
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAACG CAGTTGAGCA GTCGAGTCCG ACTGAGGAGT CGGAGGTGCT GGTGGAAGTT 
GAGGGGCTCA AAAAGTACTA CGGAGGCGAC GGACTGTTCG CCGATCCGCC GGTGAAGGCG 
GTCGACGGCG TCGACTTCGA GATCAGACGC GGCGAGACGC TCGGACTGGT CGGCGAGTCC 
GGGTGCGGGA AGAGCACGCT CGGCCGTACC CTGCTGGCAC TCGAACGCGC CACCGAGGGA 
TCGATCGTAT ACAACGGCAC CGACGTCACG ACGCTTTCCG GGACAGAGCT CAAAGAGTGG 
CGCAAGAACG CCCAGATGGT GTTCCAAGAC CCCGAGTCCA GCCTGAACGA TCGGATGACG 
GTCGGAGAGA TCATTCGGGA GCCGCTCGAC GCACACGACT GGAAGACGAT GAACGATCGG 
CGTGAGCGGG TGCTGGATCT ACTGTCGGCA GTCGGTCTCC CCGACAAACA CTACTTTCGG 
TACCCACACC AGTTCTCCGG CGGACAGCGG CAGCGGATAG GGATCGCACG AGCGCTCGCG 
CTCGAGCCGG ACTTCCTGGT CCTCGACGAA CCGGTTTCTG CCCTCGACGT GAGCGTCCAG 
GCGAAGATCA TCAGTCTCCT CGAAGACCTC CAAGAGGAGT TTAATCTCAC GTATCTGCTC 
ATCGCACACG ACCTCTCGGT GGTTCGGTAT ATCTCCGATC GTGTCGCCGT GATGTACCTC 
GGGAAGATCA TGGAAATGGG CGAGGCCGAA GAGCTGTTCA CAGACGCGTC AAATCCGTAC 
ACACAGTCGC TGTTGTCGGC GATTCCGGAA CCCGATCCGA CCGAAACGTC TCGTCGGATA 
ACCCTCTCCG GAACGCCCCC GAGCCCGAGC GACGCGCCGC CGGGCTGTAA CCTCTCGACT 
CGCTGTCCGG CGAAGATTAA ACCGGAGGCG TACGCCAACC TCGACAGCGA TCTCTGGAAC 
GCGATTGAAC AGTTCAGGGA GGTCGTTCGT GAACGCGCCC GTATCACGCT CTCGACGAGC 
GACCGGGTCA GGCGGCGGTT CGACCGGTTC GAGCGGTTTG ACGACATCGA GGAGAGCATG 
GCGGACACCT TCGATGACCT CGAGGTACCA GAGCGGGTTG ACGAACAGAT CCGGACCGCA 
GTCGAGATGG TCAAGCGCGG CCGTCCGACG GAAGCCCAAG AACACCTCTA CGACGAGTTC 
GCCAGTGTCT GCGATCGAGA ACCGCCAGAG ATGCACAAAG TGTCTGCGTC AGGTCGGTAC 
AGCTACTGCC ACCGGCACAC CGACGAGTAC GAAGACGTGG GGCCCGTGAT TACACGCCGT 
GCAGACAGCG AGTAG

Protein sequence

MSNAVEQSSP TEESEVLVEV EGLKKYYGGD GLFADPPVKA VDGVDFEIRR GETLGLVGES 
GCGKSTLGRT LLALERATEG SIVYNGTDVT TLSGTELKEW RKNAQMVFQD PESSLNDRMT 
VGEIIREPLD AHDWKTMNDR RERVLDLLSA VGLPDKHYFR YPHQFSGGQR QRIGIARALA 
LEPDFLVLDE PVSALDVSVQ AKIISLLEDL QEEFNLTYLL IAHDLSVVRY ISDRVAVMYL 
GKIMEMGEAE ELFTDASNPY TQSLLSAIPE PDPTETSRRI TLSGTPPSPS DAPPGCNLST 
RCPAKIKPEA YANLDSDLWN AIEQFREVVR ERARITLSTS DRVRRRFDRF ERFDDIEESM 
ADTFDDLEVP ERVDEQIRTA VEMVKRGRPT EAQEHLYDEF ASVCDREPPE MHKVSASGRY 
SYCHRHTDEY EDVGPVITRR ADSE