Gene Sare_1044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1044
Symbol
ID	5706543
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	1168917
End bp	1170932
Gene Length	2016 bp
Protein Length	671 aa
Translation table	11
GC content	70%
IMG OID	641270560
Product	methionine--tRNA ligase
Protein accession	YP_001535944
Protein GI	159036691
COG category	[G] Carbohydrate transport and metabolism [J] Translation, ribosomal structure and biogenesis
COG ID	[COG0143] Methionyl-tRNA synthetase [COG0662] Mannose-6-phosphate isomerase
TIGRFAM ID	[TIGR00398] methionyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.120671
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCTTCA GCAAGTACGA CCCGGATCTC CTGGAACCGG CCTTCGGCAT CGGCATGAGC 
GCCGTCGAGG GGCTCGGGAC AGGTGCCGGC TGGGGGCGGG TCGCGCCGGG TGGGGCGTCC 
ACCAGCCACC AGCACGACGA AACCGAGTTC TTCGTTGTCG TCGCCGGTGA GGGAGAGTTC 
GTCGTGGATG GTCGCCGCCA TCCGGCCCGG CCCGGCACGC TGGCCCTCTT CGAACCGTTC 
GAGTCGCACG TGCTGGAGAA CACCGGCGAT GACGACCTGG TCTTCCTCAC GCAGTACTGG 
CGCGACACCG GACGTGCCCT GATCTCGGCC GGGAACAACG AGCGGCTCGC GTTCGGTGAC 
CGCCCGGTGT TCGTCTTCTC CACCCCGCCG ACGCCCAACG GCGACCTCCA CCTCGGGCAC 
CTTTCCGGCC CGTACCTGGG CGCGGACGCG TTCGTCCGGT TCCAGCGGAT GAACGGTACC 
GAGGCATGGC ACCTGACGGG CAGCGACGAC TACCAGAGCT ACGTGGTGAA CACCGCACGG 
CGGGAGGGCC GCGCGCCCGC GGAGACCGCC GCACGCTACA GCGCCGAGAT CGCACAGACC 
CTGGCCATGA TGGACATCAA CCCTGACCAG TACACGGTCA CTGACACCGA ACCCGGCTAC 
CGGCAGGGCC TGCGGAACTT CTTCTCCCAG GTGATCGCCT CCGGGCGAGC CACGGTCACC 
GAGCGGGACG CCCTCTTCGA CGGTGAGAGC GGTCGATACC TGTACGAGGC GGATGTCCGG 
GGTGGCTGCC CCGGCTGCGG CGAGAGCACG AGCGGCAACA TCTGCGAGGA GTGCGGCGAG 
CCCAACACCG TGGTGGACCT CAGGCAGCCG AGGTCGAACG AGTCCGACGC CGAGCCGCGG 
CGGGCCCCGC TGGCCCGCTG GTCGCTGCCG CTGCACCAGT TCCGTGACGA AGTCTCCACC 
CACCACAGCC TCGGCCGCGT GCCTGCCCGG CTGCGGGAAC TCGGAGACCG CCTCTTCGCC 
CGCCCCGTCC TGGACATCCC GCTGTCGCAC CCCGCCGACT GGGGCGTCCC CCCGGCGGAG 
AAGGACGTCG ACGACCAGGT CATCTGGGTC TGGCCCGAGA TGTCGTACGG ATTTCTGCAC 
GGCATCGAGG CGCTGGGCGC CCGACTGGGC CGCGGTTGGC AGGCCGCCGT ACCCGAGCAG 
GACTGGAAGA TCGTCCACTT CTTCGGCTAC GACAACAGCT TCTACCACGC GGTGCTCTAC 
CCGGTGCTGT ACCGGCTGGC CCATCCCGGA TGGCAGCCGG ACATCGACTA CCACGTCAAC 
GAGTTCTATC TACTGGAGGG CGAAAAGTTC TCGACCAGCC GGCGGCATGC CATCTGGGGC 
AAGGAGATCC TCGACGAGGA CACCGTCGAC GCGGTCCGCT ACTTCCTCAG TCGCACCCGG 
CCCGAGGCCG AGCGCACCAA CTTCCGGCGC GCCGACTTCC GGTCGGTGCT GCACGACACG 
CTGATCGGCA CCTGGCAGCG CTGGCTGAAC GACCTCGGCG CCCGGATCGC CAGGCACTAC 
GACGGCAAGG CTCCCGACGC GGGCATCTGG ACGCCGGAGC ACTCGGCGTT CCTGGCCCGG 
CTCGGCGGCC GGCTCGACGC GGTCACCGGC TGCCTCCGCG CCGACGGCTT CAGCCTCAAC 
CAGGCCGCTG CGGAACTCGA CGCGTTGGTC GCGGAGACCC TACGCTTCGT CGGCCGGGAG 
GCCCGTACCG CGCGGAGCGC CGGGTGGCAG GACGAAGCCC GTACCGCGGT CGCCTTGGAA 
CTGGCCGCGG CCCGCCTCCT CGCCTCGGTC GCAACGCCGC TGATGCCACG CTTCGCGGGT 
CACCTGGCCA CCGCTCTCGG CCTGCCGAAG CCCACCGTAT GGCCACAAGC GGTGGAACTC 
GTTCCACCGG GGAGCGCCGT CTGCCTCGCC ACCACCGTGT TCTTCAGGCC CACCACCGAG 
CCGGCCGGGA ACGAGGACCG GGGGTCGGAT CGATGA

Protein sequence

MIFSKYDPDL LEPAFGIGMS AVEGLGTGAG WGRVAPGGAS TSHQHDETEF FVVVAGEGEF 
VVDGRRHPAR PGTLALFEPF ESHVLENTGD DDLVFLTQYW RDTGRALISA GNNERLAFGD 
RPVFVFSTPP TPNGDLHLGH LSGPYLGADA FVRFQRMNGT EAWHLTGSDD YQSYVVNTAR 
REGRAPAETA ARYSAEIAQT LAMMDINPDQ YTVTDTEPGY RQGLRNFFSQ VIASGRATVT 
ERDALFDGES GRYLYEADVR GGCPGCGEST SGNICEECGE PNTVVDLRQP RSNESDAEPR 
RAPLARWSLP LHQFRDEVST HHSLGRVPAR LRELGDRLFA RPVLDIPLSH PADWGVPPAE 
KDVDDQVIWV WPEMSYGFLH GIEALGARLG RGWQAAVPEQ DWKIVHFFGY DNSFYHAVLY 
PVLYRLAHPG WQPDIDYHVN EFYLLEGEKF STSRRHAIWG KEILDEDTVD AVRYFLSRTR 
PEAERTNFRR ADFRSVLHDT LIGTWQRWLN DLGARIARHY DGKAPDAGIW TPEHSAFLAR 
LGGRLDAVTG CLRADGFSLN QAAAELDALV AETLRFVGRE ARTARSAGWQ DEARTAVALE 
LAAARLLASV ATPLMPRFAG HLATALGLPK PTVWPQAVEL VPPGSAVCLA TTVFFRPTTE 
PAGNEDRGSD R