Gene Hlac_2472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2472
Symbol
ID	7401524
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	2450530
End bp	2452317
Gene Length	1788 bp
Protein Length	595 aa
Translation table	11
GC content	69%
IMG OID	643709544
Product	hypothetical protein
Protein accession	YP_002567115
Protein GI	222480878
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGACGGG TTCTCACCCT CTCGGTTATC GTCGCCGTGA TTGCCCTTCT CTCGATCGGT 
GCCGGCGGAG CCGTTGCCGC CGGGCCAGCG GTCGCCGGGT CGACGGCCGC CATTCCGGGG 
GACGCTCCGG CCAGCGCGAC TGCCACAGAG TGCGACGCCG GCGACGGAAC CGATCTCGTC 
GGCTGCTGGA ACGGGACCCA CTACGAGGAG GAGCTCGCCT TCAACCAGAC GGACGGGCTG 
ACCGAGGCGG AGCTGGAGGA GCTGACTCAC CTGACGATGG CCCGCGTCGA ACACGTTCGG 
GAGCGCCCCT TCCGCGAGGA CGTGCCGGTC GAGACCGTCA CCCGCTCGGC GTTCATGAAT 
GACTCTGCGA GCGCGGGCGC GGGCGGCTCG GACCCCGAGT TCCACCGCTG GAACGATCAG 
GTGTGGAAGG CCCTGTTCGT CGTCGGCGAG GACGAGAACG CCTCCGACGC GATTGACAGC 
GTCTACGGCG GTGCAGTCTC CGGGTTCTAC TCGCCGGCCG ACGACCGGAT CGTCCTCGTC 
GTCCCGGAGG GAGAGGACCC GCAGATCAAC CCGTCGACGC TGGCACACGA GCTGGTCCAC 
GCGATGCAGG ACCAGTACCA CGACCTCACC CGGCCCCGCT ACGTCGGCAC TACGCAGGAC 
GCCGACCTCG CGGTCGACGG GATCGTCGAG GGCGAGGCGG TCCACATCGA GGAGGTGTAC 
GACGCGCGCT GTGCCGGCAA CTGGAGCTGT CTCGCCGCGC CCGACTCCGG TGGCGGCGGC 
GGGTCGGCGG CGGACTACAA CTTCGGCATC CTCCAGACCG TGCTTCAGCC GTACGCCGAT 
GGCGCGCTCT ACGCCGAGAC GCTCGTCGAC GAGGAGGGGT GGAGCGCCGT CAACGAGACC 
ATGAACCGGC CGCCGAACGC GACCTCGGAG GTGATCCACC GCAACCCCGA TTACGAGACG 
ACCGAGGTAA CGTTCGAGGA CACGGCCACC GGCGGGTGGG AGACGTATCC GAATCAGGGG 
GTCAACGGCT CGGAAACCGC CGGCGAGGCG TCGATGTTCG TGATGTTCTG GTACCAGAGC 
TACGAGTACC GCCACGCGGT GTTGGACCCG GACGCGACGA TCCGGGATAA TATCCAAATT 
CACACGCAGC CGGACGAGCG GCTTCGAACT CGTGCGAACT ACAACTACGC CCACGAGGCG 
ACCGACGGTT GGGCGGGCGA CGAGCTGTAC CCCTACCGGA ACGACGGGAA CGCGGACGGG 
GACGACGCGA GCGCGACCGA CGGGGAGGAC GGCTACGTCT GGGTGACCGA GTGGCAGACG 
CCCGCGGACG CGACCGAGTT CCGCGAGGCG TACCTGCGCA TGCTGACCGC CCACGGCGGC 
GACGACCACG CCGCGGGCGA GGTGTACGAG ATCGCGGACG GCGACTTCCG CGGGGCCTAC 
GGCGTCGAGC GAAACGGGAC CACGGTGACG ATCGCGCACG CCCCCGAGCC AGCCGACGTG 
CTCGATCTCC GGCCGGAGGC CGACCTCGAA CTCTCCTCGA CCGACGACGG CGACGACGCG 
AACAGGACCG ACGGGGATGA CGGAACCGAC GGAGACGACG CGGACGGGAC CAACGACGGA 
ACCGATTCTG ACGATGGAGA CGACATCGAC CCGGACGGCG ATGACGCCGA CGGCTCCGCC 
GGTTCCGACG CTGCCACCGG CGACGACGTG CCCGGGTTCG GTCCCCTCGT CGCGCTTGTC 
GGCATACTCG CGACGGTAGC GCTCTTTGTG CGCCGCGTAC GGCCCTGA

Protein sequence

MRRVLTLSVI VAVIALLSIG AGGAVAAGPA VAGSTAAIPG DAPASATATE CDAGDGTDLV 
GCWNGTHYEE ELAFNQTDGL TEAELEELTH LTMARVEHVR ERPFREDVPV ETVTRSAFMN 
DSASAGAGGS DPEFHRWNDQ VWKALFVVGE DENASDAIDS VYGGAVSGFY SPADDRIVLV 
VPEGEDPQIN PSTLAHELVH AMQDQYHDLT RPRYVGTTQD ADLAVDGIVE GEAVHIEEVY 
DARCAGNWSC LAAPDSGGGG GSAADYNFGI LQTVLQPYAD GALYAETLVD EEGWSAVNET 
MNRPPNATSE VIHRNPDYET TEVTFEDTAT GGWETYPNQG VNGSETAGEA SMFVMFWYQS 
YEYRHAVLDP DATIRDNIQI HTQPDERLRT RANYNYAHEA TDGWAGDELY PYRNDGNADG 
DDASATDGED GYVWVTEWQT PADATEFREA YLRMLTAHGG DDHAAGEVYE IADGDFRGAY 
GVERNGTTVT IAHAPEPADV LDLRPEADLE LSSTDDGDDA NRTDGDDGTD GDDADGTNDG 
TDSDDGDDID PDGDDADGSA GSDAATGDDV PGFGPLVALV GILATVALFV RRVRP