Gene Hlac_0983 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0983
Symbol
ID	7401877
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	975003
End bp	976883
Gene Length	1881 bp
Protein Length	626 aa
Translation table	11
GC content	61%
IMG OID	643708048
Product	protein of unknown function DUF839
Protein accession	YP_002565650
Protein GI	222479413
COG category	[R] General function prediction only
COG ID	[COG3211] Predicted phosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAAACA ACTATACCCG GCGCACAGTC GTATCGAGTC TAGCCGCGTT AGCGGCGGCG 
AGCCAGACAG CGGGCAGTGT GGCTGGCAAA GAGGCAGAAG GCCAAGGCCA CGGCATCGAA 
CAGGAAGGAG CGACGCTCAA CCGCTTTGCG ACGACCATCA TCGGTGCTGA GATCACTGGC 
ATGTTCATCA CCGAGGACGG GCGGTTCTTC TTCAACGTCC AGCACCCGGA CGCGAACCTC 
GACGGGGAGG ACGAACCGGG AATTCTCGGC GCAGTCACGG GAGTAGACAT GAACCAGCTC 
CCCAGGGATT TCCAGAGCGT CCAGATTCCC GAGGGAGACG ACGACGATTA CAGCGACGAC 
GGCGACGGAG TACCCGAGCC GTACGACCAG CGGGTGCGGA CGGCACTGGG TGACTATCAG 
CGGCTTGCGA CCGGCGGCGA CGAGACCGAC GACGGCGAGG AACTGGGATC GGTCTACACA 
CCTGAGGGCG ACTCGCTCAC CGGACAGATC AACCCCGATT TCAACGGCTA CGTCCCATCG 
AGCGAGGAAC CCGACGAAGG CTACCTGTTC ACCAACTGGG AACACCGTCC GGGAGCGATG 
ACGCGAGTTC ACCTGCAGCA GAACGGCCGT AACGGCACGT GGCGGGTTCT CGGCATGGAG 
AATCTCGACT TTTCCGCCGT GGAAGGAACC TGGGTCAACT GCTTCGGGAC CGTCTCTCCG 
TGGGGCACCC CGCTGACCTC CGAGGAGAAC TACTCCATTC CGGATACGCC GGTGTGGAAC 
AACCCTGACT GGCAATACAA AGGCGGTGTC GAGCGGCTTG CACGGCACCT CGGCCACGAA 
CGAAACGATG ACGGCATCTT TGCCGATAAG TTCCCGAACC CGTACCGCTA CGGGTACATC 
GTCGAACTGA AAGAGCCGGA AAGCGAGGAG CCGATACCCG AGAAGCGGTT CGCACTCGGT 
CGCTCGACGC ACGAGAACGC GGTCGTCATG CCGGACGAGA AGACCGCCTA CACCACCTCC 
GACGGGACCG CCCGTGGCTT CTACAAATTT GTCGCCGACG AGAAGGGTGA CCTTTCCTCA 
GGAACGCTAT ACGCTGCGAA GGCCACTCAA AAGGGACCGC TCGGCGGCGA TCCCGACAAG 
GTCAGCTTCG GCATCGAGTG GATCGAACTC GGGCACGCCA GCGACGAGGA AATCGAGAAG 
TGGATTGCCG AGTACGACGA CATCACCCAG GCGGACTACG AGGACGGTGA GAACTCGTAT 
ATCTCCGAAG GGGAGATGGA CGAGTGGGCC GCAGGGGACG CAGACGACGA CCGCGTCGCC 
TTCCTCCAGT GTCGACAGGC CGCAATGCGG AAAGGCGCAA CGACGGAATT CCGCAAGATG 
GAGGGGATCA ACATCCGGCG CGGTGCCGAA GCGGGCGAGG ACTACATGTA CGTCGCCATG 
TCGAACACCA ACCGAACGAT GGGCGACGAC GAGGGCGACA TCCAGCTTAA CGGCGACGAA 
TGGGGTGCCG TCTACCGAAT GCCACTGGAG AGCGATTACG ACATCAGCGA GATGGAGCCG 
ATCGTCACCG GTGGGCCGGA GGCCAATATC TGTGGTGGCT GTCCCTACGA CGCGAATCCG 
AACGCTAACG ACAAGGCGTG CCAATCGTGC GCGTTCAACC CGACAAAGGA CGACGAAGAC 
CAAGGTCGTT TAAAGGGCAC GATGAATCTG GCAAAATCGA TGGCCATGAG TGGGCAAACC 
TCACTCGACG TGGAGAACAC GATTGCCGAA CCTGACAACA TCGTTGTCAT GGACGACGGA 
CGGGTCGTCA TTGGCGAGGA TACGGGTAAT CGTGGTCACG AGAACAACAT GATTTGGGTG 
TTCGATCCAG GTTCTGCTTG A

Protein sequence

MPNNYTRRTV VSSLAALAAA SQTAGSVAGK EAEGQGHGIE QEGATLNRFA TTIIGAEITG 
MFITEDGRFF FNVQHPDANL DGEDEPGILG AVTGVDMNQL PRDFQSVQIP EGDDDDYSDD 
GDGVPEPYDQ RVRTALGDYQ RLATGGDETD DGEELGSVYT PEGDSLTGQI NPDFNGYVPS 
SEEPDEGYLF TNWEHRPGAM TRVHLQQNGR NGTWRVLGME NLDFSAVEGT WVNCFGTVSP 
WGTPLTSEEN YSIPDTPVWN NPDWQYKGGV ERLARHLGHE RNDDGIFADK FPNPYRYGYI 
VELKEPESEE PIPEKRFALG RSTHENAVVM PDEKTAYTTS DGTARGFYKF VADEKGDLSS 
GTLYAAKATQ KGPLGGDPDK VSFGIEWIEL GHASDEEIEK WIAEYDDITQ ADYEDGENSY 
ISEGEMDEWA AGDADDDRVA FLQCRQAAMR KGATTEFRKM EGINIRRGAE AGEDYMYVAM 
SNTNRTMGDD EGDIQLNGDE WGAVYRMPLE SDYDISEMEP IVTGGPEANI CGGCPYDANP 
NANDKACQSC AFNPTKDDED QGRLKGTMNL AKSMAMSGQT SLDVENTIAE PDNIVVMDDG 
RVVIGEDTGN RGHENNMIWV FDPGSA