Gene Hhal_0949 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_0949
Symbol	metX
ID	4709393
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	1024649
End bp	1025797
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	68%
IMG OID	639855418
Product	homoserine O-acetyltransferase
Protein accession	YP_001002527
Protein GI	121997740
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCAGAA GCCCGCCAAC CGACTCTGTC GGACTGGTGA CCCAGCACAA GGCCACCTTC 
GAGGAGCCCC TGCCGCTCGT CTGCGGGAGG GAGCTGCCCC GTTATGAGCT GGTCTACGAG 
ACCTACGGCG AGCTCAATCG CGAGGGCACC AACGCCATCC TGGTCTGCCA CGCCCTCTCC 
GGCAATCACC ACGCCGCCGG TTACCACTCC GAGCACGATC GCAAACCGGG GTGGTGGGAG 
ACGTGTATCG GCCCGGGCAA GCCCCTGGAC ACCAATCGCT TCTTCGTCGT CTGCAGCAAT 
AACCTGGGCG GCTGCCACGG CTCCACCGGA CCGGCGAGCA TCAACCCGGA GACCGGCAAA 
CCCTACGGCG ACCAGTTCCC CATCGTCACC GTGCGCGACT GGGTGCGCAG CCAGGCGCGC 
CTGGCCGACG AGCTGGGTAT CCGTCAGTGG GCGGCGGTGG CCGGCGGCAG CCTGGGCGGC 
ATGCAGGCGA TGCAGTGGGC CATCGACTAC CCCGAGCGCC TGCGCCACGC CATCGTCATC 
GCCGCCGCTC CGCGGCTGTC GGCCCAGAAC ATCGGCTTCA ACGAGGTCGC CCGGCAGGCG 
ATTATGAGCG ACCCGGAGTT CCACGGCGGG CGCTACTACG ACTACGGCGT CTCGCCCCGG 
CGGGGGCTGG CGGTGGCGCG CATGCTCGGC CACATCACCT ACCTCTCGGA CGACGCCATG 
CGCGCGAAGT TCGGCCGCGA CCTGCGTGGC GACATGAGCT TCGACTTCGA GCAGGTGGAT 
TTCGAGGTCG AGAGCTACCT GCGCTACCAG GGGCAGCGCT TCGTGCAGGA CTTCGACGCC 
AACACCTACC TGCTGATGAC CAAGGCCCTC GACTACTTCG ACCCGGCCGC CGACCACGAT 
GACGACTTCT CGGCAGCCCT GGCCCACATC CAGTGCTCGA CGCTGCTGCT CTCCTTCTCC 
AGCGACTGGC GCTTCGCCCC GGCGCGCTCG CGCGAGATCC TCCGCGCGCT GCTGGAGCAC 
AACAAGCCAG TCAGCTACAT GGAGATCGAG GCCACCCAGG GCCACGACGC CTTCCTGATG 
CCCATCCAGC GCTACCTGGA GGCCTTCTCC GCCTACATGG GCAACGTCGC CCGGGAGGTG 
GGGGCGTGA

Protein sequence

MVRSPPTDSV GLVTQHKATF EEPLPLVCGR ELPRYELVYE TYGELNREGT NAILVCHALS 
GNHHAAGYHS EHDRKPGWWE TCIGPGKPLD TNRFFVVCSN NLGGCHGSTG PASINPETGK 
PYGDQFPIVT VRDWVRSQAR LADELGIRQW AAVAGGSLGG MQAMQWAIDY PERLRHAIVI 
AAAPRLSAQN IGFNEVARQA IMSDPEFHGG RYYDYGVSPR RGLAVARMLG HITYLSDDAM 
RAKFGRDLRG DMSFDFEQVD FEVESYLRYQ GQRFVQDFDA NTYLLMTKAL DYFDPAADHD 
DDFSAALAHI QCSTLLLSFS SDWRFAPARS REILRALLEH NKPVSYMEIE ATQGHDAFLM 
PIQRYLEAFS AYMGNVAREV GA