Gene Hlac_2697 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2697
Symbol
ID	7400904
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	2688799
End bp	2690094
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	69%
IMG OID	643709771
Product	ABC transporter, periplasmic binding protein, thiB subfamily
Protein accession	YP_002567338
Protein GI	222481101
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG4143] ABC-type thiamine transport system, periplasmic component
TIGRFAM ID	[TIGR01254] ABC transporter periplasmic binding protein, thiB subfamily [TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTAACG ACGACGCGAC CGAGACGGAC CGGCGTGACG CCCCCGACGA CCGGCAGGCG 
GACTCTGGCG GCGGCGCCGG CAGACGCACC GATCGACGTA CCGGGGTCCC CACCCGCCGG 
CGGTTCCTCG CGCTCGGCGG CGCGGCGGGC GCCGTCGCGC TCGCGGGGTG TAGTGCCGAG 
CCGACGGACG GTGAGGACGG AGACGGAGAA AACGGGACCG CCGGTGATGA CAGCGCCGAC 
GGGCCGGGGT CCAGCGACGG TGACGATGGC GACGGCGACG ACGAGGAGAC CCCTACCCTG 
ACGGTCGCGA CCTACAGTAG CTTCATCGAC GCGCCGTCGG TGAGTCCCGG TGAGTGGCTC 
AAGGAGGCGT TCGAGTCGCG CGTCGACGCC GAACTGGAGT GGGCGACCCC GGACAACGAG 
GTGAACTACT ACGTCGAGCG GGCCAGTTCG GGGGTGTCGA TCGACGCCGA CCTCTACGTC 
GGGCTCACCA CCGAAGACTT GGTGCGCGTC GACGAGACGC TCGACGACGA CCTGTTCGTC 
GAGCGCGGCG AGGTCGAGGG ATTCGACGAC GTGCGGGAGG GGCTGTTGTT CGACCCGTTC 
GACCGCGCGG TTCCCTTCGA CACCGGCTAC GTGAGCCTCG TGTACGACGG CACCGCGATC 
GAGGCGCCGG AGACGTTCGA GGGCCTGCTG GATGACGAGC ACGCAGGCGC GCTCATCGCG 
CAGAATCCCG GCGCCTCGAC GACGGGGCGG TCGTTCCTGC TCCACACGGT CCACCGGTTC 
GGCGACGGGC CGGACGGGTC GGTGGAGGGC GGCGACGGCG ACCCCGACTA CGACTACCTC 
GACTACTGGG CGGAGCTACA GGACAACGAC GTGCGTGTGC TCGGCTCGTG GGACGACGCC 
TACGCCGCCT GGAGCGGGGG GGAGGCCCCG ATGGTCGTCT CCTACTCGAC CGATCAGGTG 
TTCGCGAGCA TGGAGGGGGC AGACTTGGAG AAACACCAAA TTCGGTTCCT GAACGATCAG 
GCGTACGCCA ACCCGGAGGG GATGGCCGTC TTCGCCGACG CAGACGAGCC GGAGCTCGCC 
CGCGAGTTCA TGTCGTTCAT GCTGGAGCCG GACGTGCAGG GGGTTATCGC CGAGCGCAAC 
GTCGCGTTCC CCGCGACCGA CACGGCCGAG CTCCCCGACG ACTACGCCGA ACTGGCGCAG 
GAGCCGTCCG AACCGGTGAC GTTCACGTAC GACGAGCTCC AAGGCTCGGT CAGTGAGTGG 
GTCGAAGACT GGGAGCGACA GTACGCCGGG AACTGA

Protein sequence

MTNDDATETD RRDAPDDRQA DSGGGAGRRT DRRTGVPTRR RFLALGGAAG AVALAGCSAE 
PTDGEDGDGE NGTAGDDSAD GPGSSDGDDG DGDDEETPTL TVATYSSFID APSVSPGEWL 
KEAFESRVDA ELEWATPDNE VNYYVERASS GVSIDADLYV GLTTEDLVRV DETLDDDLFV 
ERGEVEGFDD VREGLLFDPF DRAVPFDTGY VSLVYDGTAI EAPETFEGLL DDEHAGALIA 
QNPGASTTGR SFLLHTVHRF GDGPDGSVEG GDGDPDYDYL DYWAELQDND VRVLGSWDDA 
YAAWSGGEAP MVVSYSTDQV FASMEGADLE KHQIRFLNDQ AYANPEGMAV FADADEPELA 
REFMSFMLEP DVQGVIAERN VAFPATDTAE LPDDYAELAQ EPSEPVTFTY DELQGSVSEW 
VEDWERQYAG N