Gene Hlac_1147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1147
Symbol
ID	7400956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1154009
End bp	1155190
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	68%
IMG OID	643708212
Product	inner-membrane translocator
Protein accession	YP_002565811
Protein GI	222479574
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4177] ABC-type branched-chain amino acid transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTCC TCTCCGACCC GAAGGGAGCA GTGGCGGATC TGACACGACC AGAGGCGTGG 
GTGCTCGGCG TCAGCGTCGC GTTCATGCTG TTCCTGCTCG GTGCGCTGCT TACCGGCGCG 
CTCGGCCCGA CGTACTTCCT GTTCCTCGTC GGGCTCGCCG GGATGTACGC ACTGCTGTCC 
TTCGGGCTGA ACGCCCAGTG GGGGTTCACC GGGCTGATCA ACTTCAGCGT CGCCGCGTTC 
TTCGGGATCG GCGCGTACGG CTCCGCGCTG ATGACCGCGA GCGGCTCGCC GATCGCGGGC 
GGGTTCAACC CGATCGTCGG GCTCGTCGTT GCGCTCGTCG CCGCGTTCGT GCTGGCACTG 
CTTATCGGTA TCCCGACGCT CCGGCTCCGG GCCGACTACC TCGCGATCGC CTCGCTCGGA 
CTGGCTGAGG TCGTCCGGCT AATCGTGCTC AACGAGCGCT GGCTGACCAA CGGGAGCGCA 
GGGCTGCGCG GCATCCCGGG CTTCTTCAAG GGGTGGCCGG TGCTCTCGAC GTTCCCGGAA 
ACGATGCCGG GACTCCGGCT CGTGGTGATC CCCGGGTCGC CGGTGATCCT TGAGACGGCG 
TTCTGGCAGG CGTTGCTGAA CGTCCTGTTG GTGCTCTCGT TTGCGGGCGC CGCGTACTTC 
GTCCTCAGGC GTGCGCACCA GTCCCCGTGG GGGCGGGTGT TGCGGACGAT CCGCTCGGAC 
GAGGACCTCG CGCGAGCGCT CGGCAAGAAC ACCTACTCGT TCAAGATGCA GTCGTTCATC 
CTCGGTAGCC TGATCATGGC GCTGGCGGGC GTGTTCTACA CCCACCTAAA CCTCTACGTC 
GGGCCGGGCG ATCTGGACCC GATCACGACG TTCTACGCGT GGGTCGCCGT AATTCTGGGC 
GGCAGCGGCT CCAACCGCGG GGCGCTGTTC GGCGGCATCG TCATCGTCAC CATCCGCGAG 
GGGACACGCT TCCTCAACGA TGTGGCGCTG CCGATCGATC CGGCGCCGCT GCGGCTGCTG 
TTGATCGGGG TCGTGATCGT CGCCGTCATG CGCTACCGGC CGCAGGGGAT CCTCCCGCCA 
CAGCGGGAGC TGATCTGGCC GAGCGCCGTC GACGGGCAGG AGGCGCCCGA TCCGCCATCT 
TCCGGCGTCC GCGAGCAGAA GGGAGGTGGT GGCGATGAGT GA

Protein sequence

MSLLSDPKGA VADLTRPEAW VLGVSVAFML FLLGALLTGA LGPTYFLFLV GLAGMYALLS 
FGLNAQWGFT GLINFSVAAF FGIGAYGSAL MTASGSPIAG GFNPIVGLVV ALVAAFVLAL 
LIGIPTLRLR ADYLAIASLG LAEVVRLIVL NERWLTNGSA GLRGIPGFFK GWPVLSTFPE 
TMPGLRLVVI PGSPVILETA FWQALLNVLL VLSFAGAAYF VLRRAHQSPW GRVLRTIRSD 
EDLARALGKN TYSFKMQSFI LGSLIMALAG VFYTHLNLYV GPGDLDPITT FYAWVAVILG 
GSGSNRGALF GGIVIVTIRE GTRFLNDVAL PIDPAPLRLL LIGVVIVAVM RYRPQGILPP 
QRELIWPSAV DGQEAPDPPS SGVREQKGGG GDE