Gene Mlg_1804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1804
Symbol
ID	4269466
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2062765
End bp	2064264
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	66%
IMG OID	638126560
Product	lysyl-tRNA synthetase
Protein accession	YP_742638
Protein GI	114320955
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1190] Lysyl-tRNA synthetase (class II)
TIGRFAM ID	[TIGR00499] lysyl-tRNA synthetase, eukaryotic and non-spirochete bacterial

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATGA CCGAGCAGGA CGACAACAAG CTCATCGCCC AGCGGCGGGA AAAGCTCGCC 
GCGTTGCGCG AGGCCGGCCA GGCCTTCCCC AACGACTTCC GCCGCGACAG CCTGGCAGCG 
GACATCCACG CCCGCTGCGC GGAGCTGGAC GACGAGGCGC TGGAGGCGGA GAACATCCGC 
GTGCGGGTGG CCGGGCGGAT GATGGCCAAG CGGGTGATGG GCAAGGCGAG CTTTACCCAC 
CTGCAGGATC AGTCCGGTCG CATCCAGCTC TTTCTGGCCC GAGATGAGCT GCCGGAGGGG 
GTCTACCAGC AGTTCAAGGG CTGGGATGTC GGTGACATCA TCGGCGCGGC GGGGACGTTG 
TTCCGCACCC GCAAGGGCGA GCTGTCGGTT AAGGTGGACG AGCTGCGCCT GCTCACCAAG 
TCGCTGCGCC CGCTGCCCGA GAAGTACCAC GGGCTGACGG ACACCGAGGC GCGCTACCGC 
CAGCGCTACG TCGACCTGAT CATGAACGAC GACTCACGCC GGGTCTTCAT GCTGCGCAGC 
CGGCTGGTGG CGGGCATTCG TGACTTTTTG AACGGCCGTG GTTTTCTCGA GGTGGAGACG 
CCGATGATGC AGCCCATTCC GGGCGGCGCG ACGGCGCGAC CGTTCGTGAC CCATCACAAC 
GCCCTGGGCG CGGACCTGTA CCTGCGGGTG GCGCCGGAGC TGTACCTGAA GCGGCTGGTG 
GTGGGCGGCT TCGAACAGGT CTACGAGATC AACCGGAATT TCCGTAACGA GGGGGTGAGC 
ACCCGCCACA ACCCCGAGTT CACGATGCTG GAGTTCTATC AGGCCTACGC GGATCACAAC 
GACCTGATGG ACCTGACCGA GGCTATGCTG CGGCGGCTGG CCGAGGAGCA GTTGGGCACG 
ACGCAGATCA CCTATCAGGG TGAAACCTTC GACTTCGGCC GGCCCTTCCG GCGGATCCGG 
ATGGTGGATG CGATCTGTGA GTTCAACCCC GACATCGGGC CGGAGGCGCT GACCGACCGG 
GATTCGGCGC TCAACCTGGC TGGGCACCTG AACATCCCGC TGATGGGGCA TGAGGGGCTC 
GGCAAGCTGC AGATGGTGAT CTTCGAGACC ACGACGGAGC ACAAGCTGCG CGAGCCCACG 
TTCGTGACCC ACTACCCCAA GGAGGTCTCG CCGCTGGCCC GGCCGGTGGA TGACGACCCC 
TTCTACACCG AGCGGTTCGA GCTGATCGTC GGCGGCCGGG AGATTGCCAA TGGCTTCTCC 
GAGCTGAACG ACGCCGAGGA CCAGGCGGAG CGGTTCCGGG CCCAGGCGGC GGAAAAGGCC 
GCCGGCGATG ACGAGGCGAT GCACTACGAC GCCGATTTCA TCCGGGCGCT GGAGTACGGG 
TTACCCCCCA CGGCGGGCGA GGGCATCGGC ATCGACCGGC TGGTGATGCT CTTCGCCGAC 
GCCCCATCCA TCCGGGACGT CCTGCTGTTC CCGGCCATGC GCCCGGAGAC GGGGGAGTAA

Protein sequence

MTMTEQDDNK LIAQRREKLA ALREAGQAFP NDFRRDSLAA DIHARCAELD DEALEAENIR 
VRVAGRMMAK RVMGKASFTH LQDQSGRIQL FLARDELPEG VYQQFKGWDV GDIIGAAGTL 
FRTRKGELSV KVDELRLLTK SLRPLPEKYH GLTDTEARYR QRYVDLIMND DSRRVFMLRS 
RLVAGIRDFL NGRGFLEVET PMMQPIPGGA TARPFVTHHN ALGADLYLRV APELYLKRLV 
VGGFEQVYEI NRNFRNEGVS TRHNPEFTML EFYQAYADHN DLMDLTEAML RRLAEEQLGT 
TQITYQGETF DFGRPFRRIR MVDAICEFNP DIGPEALTDR DSALNLAGHL NIPLMGHEGL 
GKLQMVIFET TTEHKLREPT FVTHYPKEVS PLARPVDDDP FYTERFELIV GGREIANGFS 
ELNDAEDQAE RFRAQAAEKA AGDDEAMHYD ADFIRALEYG LPPTAGEGIG IDRLVMLFAD 
APSIRDVLLF PAMRPETGE