Gene EcSMS35_4626 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4626
Symbol	genX
ID	6144552
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4727292
End bp	4728269
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	52%
IMG OID	641619442
Product	lysyl-tRNA synthetase
Protein accession	YP_001746553
Protein GI	170684036
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG2269] Truncated, possibly inactive, lysyl-tRNA synthetase (class II)
TIGRFAM ID	[TIGR00462] lysyl-tRNA synthetase-like protein GenX

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.0839984
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAAA CGGCATCCTG GCAGCCGAGC GCATCCATTC CTAACTTATT AAAACGCGCG 
GCGATTATGG CGGAGATCCG TCGTTTCTTT GCCGATCGTG GAGTGCTGGA GGTGGAGACG 
CCTTGTATGA GCCAGGCGAC GGTAACCGAT ATTCATTTGG TCCCGTTTGA GACACGTTTC 
GTTGGCCCCG GGCATTCGCA GGGGATGAAT CTCTGGTTAA TGACCAGCCC TGAATACCAT 
ATGAAACGCC TGCTGGTTGC TGGTTGTGGG CCGGTATTCC AGCTGTGCCG CAGCTTCCGT 
AATGAAGAGA TGGGGCGTTA TCACAACCCT GAGTTCACTA TGCTTGAGTG GTATCGACCG 
CACTATGATA TGTACCGGTT GATGAACGAG GTGGACGATC TCTTACAACA AGTGCTGGAC 
TGCCCGGCAG CAGAAAGCCT TTCTTATCAA CAAGCTTTCT TGCGTTATCT GGAAATTGAC 
CCGCTCTCTG CCGACAAAAC GCAACTGCGG GAAGTGGCAG CGAAACTGGA TTTGAGCAAC 
GTTGCAGATA CCGAAGAAGA CCGCGACACG TTGCTACAAT TGCTGTTTAC CTTTGGCGTA 
GAGCCAAATA TTGGCAAAGA AAAACCGACC TTTGTGTACC ACTTTCCAGC CAGCCAGGCA 
TCACTGGCGC AAATCAGTAC CGAAGATCAT CGGGTCGCTG AACGCTTTGA GGTTTATTAT 
AAAGGTATTG AGCTGGCGAA TGGTTTCCAT GAATTGACGG ATGCCCGTGA GCAGCAACAA 
CGCTTTGAAC AAGATAACCG TAAGCGCGCG GCGCGCGGTT TGCCGCAGCA CCCCATTGAC 
CAGAATCTGA TTGAAGCCTT GAAAGTCGGT ATGCCTGACT GTTCCGGCGT GGCATTAGGC 
GTTGATCGTC TGGTGATGTT GGCGCTGGGC GCGGAGACAC TGGCTGAAGT CATCGCCTTT 
AGCGTTGACC GGGCATAA

Protein sequence

MSETASWQPS ASIPNLLKRA AIMAEIRRFF ADRGVLEVET PCMSQATVTD IHLVPFETRF 
VGPGHSQGMN LWLMTSPEYH MKRLLVAGCG PVFQLCRSFR NEEMGRYHNP EFTMLEWYRP 
HYDMYRLMNE VDDLLQQVLD CPAAESLSYQ QAFLRYLEID PLSADKTQLR EVAAKLDLSN 
VADTEEDRDT LLQLLFTFGV EPNIGKEKPT FVYHFPASQA SLAQISTEDH RVAERFEVYY 
KGIELANGFH ELTDAREQQQ RFEQDNRKRA ARGLPQHPID QNLIEALKVG MPDCSGVALG 
VDRLVMLALG AETLAEVIAF SVDRA