Gene Hlac_0940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0940
Symbol
ID	7401312
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	938748
End bp	939785
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	63%
IMG OID	643708006
Product	protein of unknown function UPF0118
Protein accession	YP_002565608
Protein GI	222479371
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.726387
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.96935
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAGACA GATCCGCCCC CCCGACGTGG CTCGTCGGGA AACCAGGGCT GACCGCACTC 
GTCCTGCTGA GCAGTCTCCT CGCGTTGTTC GTCCTCCTGC CGTATCTCCA GTTCATTCTG 
TTCGGCGTGG TTCTCGCATA CATCCTGTTT CCCGTCCAAC AACGAGCCGA GCAGCACGTC 
AGGCCCACAA TCGCGGCGAT TGTCATTGTC TTGGGCGCGT TACTGTTCGT ACTGATCCCG 
ATCATCTATC TCCTCACGAT CGCCGTCCAA CAGTCGCTCA GGGTCGTGAG TGCCGTCAGA 
AACGGACAAA TCGACGTTGC GTCGATCGAA GAACTCCTCG AGAGTACCGG ATACCGCATC 
GACCTCGTCG CGCTGTACGA ATCGAATCAG GAACGGATCG CAACAAGTCT CCAAGAGGTC 
ACGTCAGGGG CGATCGACCT CGCCGGGAGT TTGCCAGGGC TGTTTATCGG ACTGACCATC 
ACGCTGTTCG TCCTCTTCGC CCTGTTGCGC GACGGGGAAC AGCTCGTGGC GTGGGTCCAG 
TGGGTGCTGC CGGTCGACGA GGACATCCTG GACGAACTCC GCGAGGGACT GGATCAGCTC 
ATGTGGGCCT CTGTCGTCGG GAACGTCGCC GTCGCGGCCA TTCAGGCGGC GCTCCTCGGC 
GTCGGGCTCG CGATCGCCGG CCTCCCCGCC GTGATCTTTC TCACGGTCGT TACGTTCGTG 
CTGACGCTGC TCCCGCTCGT CGGCGCGTTC GGCGTCTGGG TCCCGGCTGC AATGTATCTC 
CTCGCAGTCG GACGACCGAT TGCCAGCGCG GCGATAGCCG TGTACGGCCT GCTCGTTACC 
TTCTCCGATA CGTACCTCCG ACCCGCGCTA ATCGGTCGGA CCGGCGCATT CAACTCCGCT 
ATCATCGTCA TCGGCATCTT CGGCGGGCTC GTCGTATTCG GCGCCGTCGG CCTGTTCATC 
GGCCCCGTCG TCCTCGGCGG CGCGAAACTC GTCCTCGATT GCTTCGCTCG GGAACACACC 
GGAGAGCCGA CTGCTTGA

Protein sequence

MPDRSAPPTW LVGKPGLTAL VLLSSLLALF VLLPYLQFIL FGVVLAYILF PVQQRAEQHV 
RPTIAAIVIV LGALLFVLIP IIYLLTIAVQ QSLRVVSAVR NGQIDVASIE ELLESTGYRI 
DLVALYESNQ ERIATSLQEV TSGAIDLAGS LPGLFIGLTI TLFVLFALLR DGEQLVAWVQ 
WVLPVDEDIL DELREGLDQL MWASVVGNVA VAAIQAALLG VGLAIAGLPA VIFLTVVTFV 
LTLLPLVGAF GVWVPAAMYL LAVGRPIASA AIAVYGLLVT FSDTYLRPAL IGRTGAFNSA 
IIVIGIFGGL VVFGAVGLFI GPVVLGGAKL VLDCFAREHT GEPTA