Gene Hlac_0447 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0447
Symbol	metG
ID	7401065
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	463085
End bp	465229
Gene Length	2145 bp
Protein Length	714 aa
Translation table	11
GC content	68%
IMG OID	643707511
Product	methionyl-tRNA synthetase
Protein accession	YP_002565119
Protein GI	222478882
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0143] Methionyl-tRNA synthetase
TIGRFAM ID	[TIGR00398] methionyl-tRNA synthetase [TIGR00399] methionyl-tRNA synthetase C-terminal region/beta chain

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.381782
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCACG ACGACTTCCC CACCGACGAT CCGGCGGTGG TGACCTGTGG ACTGCCGTAC 
GCCAACGGCG ACCTCCACAT CGGCCACCTC CGCACCTACG TCGGCGGCGA CGTGTACCGG 
CGCGCGCTCG AACGACTCGG GCAGGAGACC GCGTTCGTCT CCGGCTCCGA CATGCACGGC 
ACCCCCGTCG CGGTCAACGC CGAGCAGGAG GGGGTCTCCC CCGAGCAGTT CGCGCTCGAC 
TGGCACGAGC AGTACGCCGC GACGTTCCCG AAGTTCAACG TCGAGTTCGA CAACTACGGC 
CACACCCACG ACGAGACGAA CACGGCGGTG ACCCAACAGC TCGTCCGTGA CCTCGACGAG 
GGCGGCCACC TCTACGAGAA GGAGATCATG GTCGCGTACG ACCCCGTCGA CGACCAGTTC 
CTCCCGGACC GGTACGTCGA GGGGACCTGC CCCTACTGCG GTGCACACGC CCGCGGCGAC 
GAGTGCGACG AGGGGTGCCA GCGCCACCTC GAACCCGGCG AGGTCGAGGA CCCCGAATCG 
ACGATCACCG GCAACCCCGC CGAGTACCGC GAGCGCACCC ACCAGTTCTT CGAAGTCTCC 
GCGTTCTCCG AGTACCTCTC CGGCTTCCTC GATCGGCTGG AGGGGACCTC GAACGCCCGG 
AACCAGCCCC GCGAGTGGAT CGAGCAGGGG CTCCAAGACT GGTGTATCAC CCGCGACATG 
GACTGGGGGA TCGACTACCC CGGCGAAAAC CCGCAGGACC TCGTCTTATA CGTCTGGGTC 
GACGCCCCGA TCGAGTATAT CTCCTCGACG AAGCAGTACA CCGAGCGCGT CGGCGCCGAC 
GCCTTCGACT GGGAGGCCGC GTGGAAGGAG GGCGCGAGCG ACGCGCACCC CGAGGGCGGC 
GAGATCGTCC ACGTGATCGG CCGCGACATC ATTCAACATC ACACGATCTT CTGGCCCGCG 
ATGCTGGAGG CGACCGACCA CACCGAGCCG CGCGCCGTGA TGGCGAGCGG CTTCGTCACC 
CTCGGCGGCA AGGGCTTCTC CACGAGCCGC GACCGCGCGG TCTGGGCCGA CGAGTACCTC 
GACGAGGGGT TCCATCCCGA CCCGCTGCGC TACTACCTCG CGACCAACGG CGGGTTCCAG 
CAGGACGTGG ACTTCTCGTG GGAGAAGTTC CGCGACCGCG TCAACACCGA GCTGGTGGGG 
ACCGTCGGCA ACTTCCTCTA CCGCTCGCTG CTCTTCGCCC ACCGCAACTA CGACGACGCG 
CCCATCGCGG ACGCGACGAG CGACGAGGTC GCCGAGCGGA TCGAGGAGGC GATCGCCGAC 
TTCGAGGCCG CCGTCAACGA CTACTCCGTG CGCGCGGTCG GCGACGCCGT CACCGACCTC 
GCCCGGTTCG GCAACGAGTA CATCCAGCGC AGCGAGCCGT GGAAGCTCGT GGACGACGAC 
CCCGAGGAGG CCGCGCAGGT CATCCACGAC TGCGTCGCGA TCGCGAAGGC GATCGCGGTC 
CTGTTCGAGC CCATCGCACC CGAGAAGACC GAGCGTCTCT GGGACCAGCT CGGCGAGGAC 
GGCTCGGTCC ACGAGACCAC CGTCGAGGCG GCCCGCGAGG GCCCCGCCGG CGACCTCGCG 
GAGCCGACGG AGCTGTTCGA GCAGATCGAA GACGAGCGCG TCGAGGCGCT CAACGAGAAG 
CTGGAGGCGC GCGCCGCCGA GGCGGAGGAC GGCGACGAAG CGGACGAGGA GAGCGGCGAC 
GACGGCGAGG CGGACGACGG CAGCGACGAA GCGGACGACG ACACCACTGA CGAACCCGAC 
ATGACCGACA TCGAACCCCT CAGCGACGAC CGCATCAGCT TCGACGACTT CCAGGAACTG 
GACATCCGGA TCGGCCGGAT CGAGGAGGCG GAGGGTATCG AGGGCGCCGA CGACCTCCTG 
AAGCTCCGCG TCGACCTCGG CGCGGAGACC CGGACGATCG TCGCGGGGCT CAAACAACTC 
CACGACGTGG ACGACCTGCC CGGAACGAAG GTCGTCGTGC TCGCGAACAT GGAGAAGGCG 
GAGCTGTTCG GCGTCGAGTC GAACGGGATG GTGCTCGCCG CCGGCGAGGA GGCCGACCTC 
CTCACCACCT ACGAGGACGC CGGGCCGGGG ACGAAGGTGA AGTAA

Protein sequence

MSHDDFPTDD PAVVTCGLPY ANGDLHIGHL RTYVGGDVYR RALERLGQET AFVSGSDMHG 
TPVAVNAEQE GVSPEQFALD WHEQYAATFP KFNVEFDNYG HTHDETNTAV TQQLVRDLDE 
GGHLYEKEIM VAYDPVDDQF LPDRYVEGTC PYCGAHARGD ECDEGCQRHL EPGEVEDPES 
TITGNPAEYR ERTHQFFEVS AFSEYLSGFL DRLEGTSNAR NQPREWIEQG LQDWCITRDM 
DWGIDYPGEN PQDLVLYVWV DAPIEYISST KQYTERVGAD AFDWEAAWKE GASDAHPEGG 
EIVHVIGRDI IQHHTIFWPA MLEATDHTEP RAVMASGFVT LGGKGFSTSR DRAVWADEYL 
DEGFHPDPLR YYLATNGGFQ QDVDFSWEKF RDRVNTELVG TVGNFLYRSL LFAHRNYDDA 
PIADATSDEV AERIEEAIAD FEAAVNDYSV RAVGDAVTDL ARFGNEYIQR SEPWKLVDDD 
PEEAAQVIHD CVAIAKAIAV LFEPIAPEKT ERLWDQLGED GSVHETTVEA AREGPAGDLA 
EPTELFEQIE DERVEALNEK LEARAAEAED GDEADEESGD DGEADDGSDE ADDDTTDEPD 
MTDIEPLSDD RISFDDFQEL DIRIGRIEEA EGIEGADDLL KLRVDLGAET RTIVAGLKQL 
HDVDDLPGTK VVVLANMEKA ELFGVESNGM VLAAGEEADL LTTYEDAGPG TKVK