Gene Sare_2149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2149
Symbol
ID	5706967
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	2471776
End bp	2473386
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	72%
IMG OID	641271634
Product	methionine--tRNA ligase
Protein accession	YP_001537005
Protein GI	159037752
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0143] Methionyl-tRNA synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.147199
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCTG ACCCGCACCG ACCGGCCGTC ATCATCGCCG CGACCCCGAC TCCCAACGGT 
GACCTGCACC TGGGCCACCT CGCCGGGCCG TACCTCGCCG CCGACGTCTA CGCCCGCCAC 
CTGCGCATGT CGGGTCGCCC CGTGGTCTAC ACCACGTGCA CCGACGACAG CCAGAGCTAC 
GTGCTGACCA CCGCACGCCG ACAGGGGGTG CCACCTCGAC GTCTGGCGGC CACCGCCGCC 
ACAGCTATCG CCCGCTCGCT GGACGCCGTC GGGATCTCCA CCGCGGGGCT CCCCCCGACC 
GGCGACACCT ACCGCGGCAC GGTGCTCGAC TTCGTTGGCC AACTGCATGC GGCGGGCCGG 
TTCCGACAGC GCCGCGTACG GCTGCCGTAC GCCCGCCACG CGGGGATGTA CCTCTACGAC 
GGGCTGCTCT CCGGCACCTG CCCGACCTGC CTGTCGGACA GCTCCGGTGG GGTCTGTGAG 
GCCTGCGGAC ACCCGAACAC CTTCGACGAC CTGTTGGATC CTCGGTACAG CCTCGATCCG 
GACGACCCGG TGGAGCCGCG GGTCGCCGAC GTCCTCGTGC TGCCCGCGGA GGACTACCGG 
GGTCGGCTCG CCGAGTACTA CGCGCGGCAC ACGCCGCGGT GGCGCCCGCA CGCGCGGCGG 
CTCGTCAACG AACTACTCGC CCGGCCGCTA CCTGACATCC CGGTCACGGT ACCGGGCAGT 
TGGGGCATCC CCGCGCCGTT CGCGCAGACC CCGGGGCAGG TCCTCTATCC GTGGATCGAG 
GCGATGCCCG CCTCGATCTA CAGCACCTGG TGGTCGCGCT CGCCGCGGGG CGCCACCGGC 
GGGAACATCG ACGCCCCGTG GCGGGCCGAG ACGGACACCG AGCTGGTCTA CTTCCACGGA 
TACGACAACG TGTACCACTG GGGCCTGGTC GATCTGGTCC TGTTGTTGGC GCACGGTGAT 
CGGTACGTGC TGCCCGCGGC GAACGTGTGC AACGAGTTCT ACGAACTGGC CGGAGCCAAG 
TTCTCCACCA GTCGCGACCA CCTGGTGCAC GCACCCGAGG TCCTCGCCGA GGTACCCCGG 
GATCTGTTGC GCTTCTACCT GGCGCTGACC GCCCCGGAGT ACCAGCGATC CACGTTCGAC 
CGGGCGGCCC TGCCCTCGGT GACGCAGACC CGGCTGGTCG AGCCATGGAA CCGTCTCTCC 
CGGGCCCTCG ACCGGGCACT CGACGCGTCA TCCATGCCGG CCCGGCTGCC CACGGACGAG 
GCTGGCCGGC GCCGCGCCGC CATCGTCGCC GACCGCTTCC GCACCTGGTA CGGACTGCCG 
GAGTTCAGTA TCCGCCAAGC AGCCGACACG CTCAGCACGC AGGTCGATCG GCTGGCCCGG 
CAGGCAGAGG TGCTCACCGG GGATCCGACC GACACCGGTG GCCTCGTGCT GCAGGTCCGC 
GCACTCCTCG CCGGCGCCGC TCCGCTGCTG GTCGATACCG CGGCAGCCGC CGCCGCGTCC 
GGTTGGGAGA GCGGCGACGC CACCGCGCCG TCGACCACCG TCGCCGCCCT GCGCCTGCCA 
CCACTGGCCG GTGTCCGCGC CCCGCAGGAC GGACGCCTAC CGGTGCGGTG A

Protein sequence

MTADPHRPAV IIAATPTPNG DLHLGHLAGP YLAADVYARH LRMSGRPVVY TTCTDDSQSY 
VLTTARRQGV PPRRLAATAA TAIARSLDAV GISTAGLPPT GDTYRGTVLD FVGQLHAAGR 
FRQRRVRLPY ARHAGMYLYD GLLSGTCPTC LSDSSGGVCE ACGHPNTFDD LLDPRYSLDP 
DDPVEPRVAD VLVLPAEDYR GRLAEYYARH TPRWRPHARR LVNELLARPL PDIPVTVPGS 
WGIPAPFAQT PGQVLYPWIE AMPASIYSTW WSRSPRGATG GNIDAPWRAE TDTELVYFHG 
YDNVYHWGLV DLVLLLAHGD RYVLPAANVC NEFYELAGAK FSTSRDHLVH APEVLAEVPR 
DLLRFYLALT APEYQRSTFD RAALPSVTQT RLVEPWNRLS RALDRALDAS SMPARLPTDE 
AGRRRAAIVA DRFRTWYGLP EFSIRQAADT LSTQVDRLAR QAEVLTGDPT DTGGLVLQVR 
ALLAGAAPLL VDTAAAAAAS GWESGDATAP STTVAALRLP PLAGVRAPQD GRLPVR