Gene Hlac_2171 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2171
Symbol
ID	7401104
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	2159174
End bp	2160604
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	73%
IMG OID	643709241
Product	hypothetical protein
Protein accession	YP_002566818
Protein GI	222480581
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.519692
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCGCG GCCCCCTAAC AGGGGTGACA TTGACACCCA CGAGAACCAC AGCCGCGCTG 
CTGGCCCTGC TGGCGCTACT GGGGGCCGTC GGCGCGGTCA CGGCGGTGCC CGACGCCCGG 
ATCGCGATCG ACGGGGTCGA CGTGAGTTCG AGCGATCCCG CCGTCGGCGA GCGGACGGCC 
CTGAACGTGA CCGTCTCGAA CTCCGGCGGA AGCCCCGCGG CGGCCGACGT GACGAGCGTC 
CGCCTCCTCG ACGCAAGCGG TGGGGACGGT GACGGAGGGA ACGACGGAGA CGGCGACCCC 
CGCGACGAGG CGACCGCGGT CGGGGCGCTC TCGGCGGGCG ACGCGACGGA CGTGGTCCTC 
TGGACCCGGT TCGGCGAGCC GGGCGAGCAC CGGCTCACGG TCGAGGTCGT CGCCGAGCAA 
GAGGCGACGG GCGACGACGA CGACGGCGGG ACCGTCACCG TGACCCGCGA CGTGGTCGTC 
GACGTCCAGC CGGCCGAGAT CGCGCTCGAC GTGCGCACCC GAGCGCTCTC GCCGGCGGAC 
CTCCGGAGCG ACGACGAGGA CCAGAACGCC GGCGGGATCA GCCTCGGCGG CATCGAGGGC 
GTCTTCGGCG GTGGCGGCGG GCTCCAGACC GCCGAAGACG ACGAGACCGA GTCGGTCCAG 
TCGGCCGACT CCCCGGTCGC GGTGACCGTC GTCAACACCG GGACATCGAC GGCCGACCGC 
GTGAGCCTGA CCGCTGTCAC AACACCGGTC GGGACGAGCG ACGGCGAGGG CTCCGGCGAC 
GGTAACGAAA CGGATCCGAC CGTCGAGGTC GGCCCCTTCG TCGTGGAGGA TGTCGCGCCC 
GGCGAAGAGC GGCAGGTGGT CGTCGACCTC GGTCCCCTCG ACGAGCGCTC GGACGTGACG 
GTCACGGCGG CGTTCCGGTC CGAACTCGAC GCGCGAGCGG GCACCGGTGC GAACCGGACG 
GCGACGTCGA CGCTCCGGTA TCCGCCGCGG GAGGGGAGCC CGACCGTCAC CGACGCGACC 
GTCGAGACGA CCGCCGACGG CGAAGTGGTC GTGGACGCCA ACCTCGGCAA CGCGGGCACC 
GGCGAGCTAG AGGGCGTCGT CGTCTCGGTC GCCGGCGCCG AGGGGGTCGA GCCGACTCCG 
GCCGGCCGAG AGTACTTCGT CGGCAGCGTG GGCGCGGGCG ACTTCGTCGC CTTCGACCTG 
CGGACCGCGG TGAACGCTTC CGTGGCGGAC GAGGTCCCGA TCCGGATCGC GTACACCGAG 
CGCGGCGTCC GATACACCGA GACCGAGACG GTGGCGCTTC CCGATTCGGG CGACGGTGGT 
GGAGGGGGAT CCGGCGCCGT CGGGACGCTC GGAGCGATCG GCATCGTCGG GCTCGTCGGC 
GGCGCGGGGG TCGCGGTCGC CGGGAGCGTG ATCCGTCGTC GCGATGTATA G

Protein sequence

MPRGPLTGVT LTPTRTTAAL LALLALLGAV GAVTAVPDAR IAIDGVDVSS SDPAVGERTA 
LNVTVSNSGG SPAAADVTSV RLLDASGGDG DGGNDGDGDP RDEATAVGAL SAGDATDVVL 
WTRFGEPGEH RLTVEVVAEQ EATGDDDDGG TVTVTRDVVV DVQPAEIALD VRTRALSPAD 
LRSDDEDQNA GGISLGGIEG VFGGGGGLQT AEDDETESVQ SADSPVAVTV VNTGTSTADR 
VSLTAVTTPV GTSDGEGSGD GNETDPTVEV GPFVVEDVAP GEERQVVVDL GPLDERSDVT 
VTAAFRSELD ARAGTGANRT ATSTLRYPPR EGSPTVTDAT VETTADGEVV VDANLGNAGT 
GELEGVVVSV AGAEGVEPTP AGREYFVGSV GAGDFVAFDL RTAVNASVAD EVPIRIAYTE 
RGVRYTETET VALPDSGDGG GGGSGAVGTL GAIGIVGLVG GAGVAVAGSV IRRRDV