Gene Emin_1224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1224
Symbol
ID	6263535
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	1324440
End bp	1325561
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	42%
IMG OID	642611702
Product	tryptophanyl-tRNA synthetase
Protein accession	YP_001876111
Protein GI	187251629
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0180] Tryptophanyl-tRNA synthetase
TIGRFAM ID	[TIGR00233] tryptophanyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.142423
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.402373
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAAAG AAGAAAATAA TATTATAGTC TCGGGCATGC GCCCCACTGG AAGATTGCAT 
TTGGGTAACT ATCACGGCGC TTTAAAAAAC TGGGTGGATT TACAAGATAA ATATAAATGT 
TATTTTTTTG TGGCCGATTT GCACGCTTTA ACAACCGCGT ATGACAGAAC GGAAAACATA 
GCAAACAACA GTTATGAAAT GGTTATTGAC TGGCTGACTG CGGGGCTTGA TTCTAAAAAA 
TGTACTCTTT TTATACAATC GCACATACCG CAGGTAAGCG AACTTAATTT GCTTTTGGGC 
ATGATTACGC CTGTAGGTTG GCTTTTAAGA AATCCTTCCT ACAAAGAACA ATTAACGGAA 
ATTTTTAAGA AAAAATATGC CGGGCAGGAA GCTAACATTA AAATAGAACG CGCCGAACAG 
CGTGAGGGGG GCGTTGTACA GCTTTCCCAA AAAGTTACTT TAGCGGGCGG GCTTAGCGAG 
CTTACCGAGC AGGAGCTTAA TGAGCTTGCC GTGTACGGGT TTTTAGGGTA TCCTGTTTTA 
ATGGCTACGG ATATTTTAAT TCACAAAGCG TCTATGGTTC CGGTAGGACA GGATCAGGTT 
GCCCATTTGG AAATAGCGCG TGACATAGTG CGCAGATTTA AAGATATTTA CCACTCGGAT 
ATTTTAGTAG AGCCCAAACC TTTGCTTACA AAGGTATCAA GAGTACCTGG TTTGGACGGG 
CGCAAAATGT CCAAATCTTA CAATAACACA ATAGAGCTTG GCGAAGATGT TGACGCGGTA 
AGAAAGAAAG TTATGACCAT GTTTACCGAC CCGAACAAGA AAAGAGCCAA CGACCCTGGG 
AATCCCGACG GCTGCGTAGT ATTTTCTTTC CACAAAATTT ATAACCCGGA TTATGAAAAA 
CGCTGCGCCG AATGTAAAGC CGGCGCTTTA GGATGCGTGC AGTGTAAAAA GGACTTGTTT 
GCTTTTATGG AACCTGAGGT AAAAGAATTT AACGAAAAAC GCAAAATATT TTCAAGCGAC 
AGGGCTGAAA TTGAAAAACT TTTACAAGGC GAAGCTAAAG AAGCTATGCG CTCAGCCCAG 
GTCACTTTAG ACGAAGTCAG AAAAACAATG AGGCTTGCAT AA

Protein sequence

MSKEENNIIV SGMRPTGRLH LGNYHGALKN WVDLQDKYKC YFFVADLHAL TTAYDRTENI 
ANNSYEMVID WLTAGLDSKK CTLFIQSHIP QVSELNLLLG MITPVGWLLR NPSYKEQLTE 
IFKKKYAGQE ANIKIERAEQ REGGVVQLSQ KVTLAGGLSE LTEQELNELA VYGFLGYPVL 
MATDILIHKA SMVPVGQDQV AHLEIARDIV RRFKDIYHSD ILVEPKPLLT KVSRVPGLDG 
RKMSKSYNNT IELGEDVDAV RKKVMTMFTD PNKKRANDPG NPDGCVVFSF HKIYNPDYEK 
RCAECKAGAL GCVQCKKDLF AFMEPEVKEF NEKRKIFSSD RAEIEKLLQG EAKEAMRSAQ 
VTLDEVRKTM RLA