Gene Hlac_2098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2098
Symbol
ID	7400618
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	2088483
End bp	2089604
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	68%
IMG OID	643709168
Product	inner-membrane translocator
Protein accession	YP_002566745
Protein GI	222480508
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0559] Branched-chain amino acid ABC-type transport system, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0236105
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAACAA CTGAATCGTC GATCGTCGAC TCGGCGCGGG CCCGGCCGGG GCTTCTCCTC 
GTCGTTCTGC TCGGCGGCCT GTTGCTCGTC GACCTCGCCG CGAAGCTCGC CGGTTTCTCG 
ATTCTCCCGA TCGGCGAGGC GATCTCGATC GATCGGCTCG GCTCGAACCT CTGGAACGGG 
GTCGTGATCG GGCTCGTAAT CGGGCTCGCC GGAATCGGCC TCTCGATGAC GTACAGCATC 
CTCTCGTTCG CGAACTTCTC GCACGGCGAC CTGCTTAGCA CCGGGGCGTT CACCGGCTGG 
GGCGTCGCGT TCCTGATCGC CGGATTCGGC GATATCCCGG TTCGGGCGCT GCTGACCGTT 
GGGGACGCCG GGAGCGCGAC CCCCGGCGAC ATCGGGGCGC ACATCCTCTC GACGCCGGTC 
GCGATACTCG TCGGGCTGCT CGTGGCCTTT GCGGCCACCG CCGCCGTCGC GCTGGCGCTC 
GACCGCGCGT TCTACAAGCC GATGCGGGAC CGCGACGGGA TCTCGATCCT CATCGCGTCG 
ATCGGCGCTG CGCTGATCGT CCGGTACGTG ATCCAGTTCG TCTACGGCTC CGACCGGCGC 
GGCGTCACGG CGGCCATCGA CGCCTCGAAC CTGGCGTTCG ACCCGCTCGG GCTCTCCGTC 
AACGCTCACG AGCTGACCAT CGTCGTCGCC GCGATCGGGC TCATGCTCGC GATGCACTTC 
ATGCTCCAGC GCACGAAGCT CGGCACCGCG ATGCGGGCGA TGGCCGACAA CAAGGACCTC 
GCCCTCGTCA CCGGCATTCC GGCCGAGCGC GTCGTCACTG CCACGTGGAT CATCGGCGGC 
GGGCTGGCGG GCGCCTCGGG GTACCTCTAC GTGCTGCTCC GCGGGACGAT CCAGTTCGAC 
TTCGGCTGGC TGCTGCTCCT CTTAATCTTC GCGGCCGTGA TCCTCGGCGG GATCGGCTCG 
GTGTACGGCG CGATCGCCGG CGGGCTCGTC ATCGGGATCG TCTTCACCAC CTCGACGGTC 
TGGATCCCGT CCGACTTCAA CCAGGCCGCC GCGTTCGCCG TGATGATCAC CATGCTCCTG 
TTGCGCCCCG AGGGGCTCTT CGGAGGTGTT TCGACCGCAT GA

Protein sequence

MGTTESSIVD SARARPGLLL VVLLGGLLLV DLAAKLAGFS ILPIGEAISI DRLGSNLWNG 
VVIGLVIGLA GIGLSMTYSI LSFANFSHGD LLSTGAFTGW GVAFLIAGFG DIPVRALLTV 
GDAGSATPGD IGAHILSTPV AILVGLLVAF AATAAVALAL DRAFYKPMRD RDGISILIAS 
IGAALIVRYV IQFVYGSDRR GVTAAIDASN LAFDPLGLSV NAHELTIVVA AIGLMLAMHF 
MLQRTKLGTA MRAMADNKDL ALVTGIPAER VVTATWIIGG GLAGASGYLY VLLRGTIQFD 
FGWLLLLLIF AAVILGGIGS VYGAIAGGLV IGIVFTTSTV WIPSDFNQAA AFAVMITMLL 
LRPEGLFGGV STA