Gene Mlg_0438 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0438
Symbol
ID	4268291
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	486713
End bp	487912
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	64%
IMG OID	638125168
Product	tyrosyl-tRNA synthetase
Protein accession	YP_741282
Protein GI	114319599
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0162] Tyrosyl-tRNA synthetase
TIGRFAM ID	[TIGR00234] tyrosyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000725763
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.0537593
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAGG CAAATGATGC CATGGCACTG TTGCGCCGCG GTGCCGAGGA GATCCTGCTG 
GAGAACGAGC TGCGGGACAA GCTCCAGTAT GATCGTCCGC TGCGCGTCAA GGCCGGCTTC 
GATCCCACCG CGCCGGACCT TCACCTGGGC CATACGGTGC TGATCAATAA GCTGCGTCAG 
TTCCAGGATC TGGGGCATGA GGTCTACTTC CTGATCGGTG ATTTCACCGG GATGATTGGG 
GACCCCAGCG GCAAAAGCGC CACCCGCCCC CCACTTACTC GCGAGGAGGT GCGCGACAAC 
GCCCGCACCT ACGAGGAACA AATCTTCCAG GTGCTGGATC CGGAGCGCAC CCAGGTGGTG 
TTTAACTCCG ACTGGATGAA CGATTTCTCC GCTGCGGACA TGATCCGGCT GGCCTCCCAC 
CATACCGTCG CGCGCATGCT GGAGCGCGAC GACTTTCATA AGCGTTATGC CGCCCGCCAG 
CCCATCGCCA TCCACGAGTT CCTCTACCCG CTGGTCCAGG GGTACGACTC GGTCGCCCTG 
AAGGCGGACG TCGAGCTGGG CGGCACCGAT CAGAAGTTCA ACCTGCTGGT GGGGCGGGAG 
CTACAGAAGG CCTACGGCCA GTCTCCGCAG ACGGTGCTGA CCATGCCCTT GCTGGAGGGG 
CTGGACGGCG TGCAGAAGAT GTCCAAGTCG CTGGGCAACT ACGTGGGGAT CAAAGAACCG 
GCTGAGGAGA TGTTCGGAAA GCTGATGTCC ATCTCCGATG ACCTCATGTG GCGCTACTTC 
CTGTTGCTCA GCTTCCGACC GGAGAGCGAG ATCGAGCGGC TCCGCCGTGA CGTCGCCGAA 
GGGCGCAATC CCCGGGACGT CAAGTTTGAA CTGGCCGAGG AGATCGTCAC CCGATTTCAC 
GACGCGCGCG CGGCGGCGCG CGCGAGAGAG GTGTTCATCG CCCGGTTCCG GAAAGGCGCC 
ATGCCGGAGG AGATGCCGGA ACACACCCTG CCCGCCGACG ATGGCGGCCT GGCCCTCGAT 
CGGTTGCTCA AGGGGGCCGG CCTGGTGGCC AGCACCTCGG ACGCCCGGCG CATGCTCAAG 
CAGGGCGCGG TGCGCATCGA TGGCGAGCGT GTGGAGGATC AACGACTTGT GGTGCCCGCC 
GGCGAGACCC ATGTCTATCA GGTGGGCAAG CGCCGTTTCG CCCGTGTGAC CGTGGCGTGA

Protein sequence

MTEANDAMAL LRRGAEEILL ENELRDKLQY DRPLRVKAGF DPTAPDLHLG HTVLINKLRQ 
FQDLGHEVYF LIGDFTGMIG DPSGKSATRP PLTREEVRDN ARTYEEQIFQ VLDPERTQVV 
FNSDWMNDFS AADMIRLASH HTVARMLERD DFHKRYAARQ PIAIHEFLYP LVQGYDSVAL 
KADVELGGTD QKFNLLVGRE LQKAYGQSPQ TVLTMPLLEG LDGVQKMSKS LGNYVGIKEP 
AEEMFGKLMS ISDDLMWRYF LLLSFRPESE IERLRRDVAE GRNPRDVKFE LAEEIVTRFH 
DARAAARARE VFIARFRKGA MPEEMPEHTL PADDGGLALD RLLKGAGLVA STSDARRMLK 
QGAVRIDGER VEDQRLVVPA GETHVYQVGK RRFARVTVA