Gene EcolC_1992 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1992
Symbol
ID	6068155
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2199453
End bp	2200727
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	52%
IMG OID	641601406
Product	tyrosyl-tRNA synthetase
Protein accession	YP_001724965
Protein GI	170020011
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0162] Tyrosyl-tRNA synthetase
TIGRFAM ID	[TIGR00234] tyrosyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.013475
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAGCA GTAACTTGAT TAAACAATTG CAAGAGCGGG GGCTGGTAGC CCAGGTGACG 
GACGAGGAAG CGTTAGCAGA GCGACTGGCG CAAGGCCCGA TCGCGCTCTA TTGCGGCTTC 
GATCCTACCG CTGACAGCTT GCATTTGGGG CATCTTGTTC CATTGTTATG CCTGAAACGC 
TTCCAGCAGG CGGGCCACAA GCCGGTTGCG CTGGTAGGCG GCGCGACGGG TCTGATTGGC 
GACCCGAGCT TCAAAGCTGC CGAGCGTAAG CTGAACACCG AAGAAACTGT TCAGGAGTGG 
GTGGACAAAA TCCGTAAGCA GGTTGCCCCG TTCCTCGATT TCGACTGTGG AGAAAACTCT 
GCTATCGCGG CGAACAACTA TGACTGGTTC GGCAATATGA ATGTGCTGAC CTTCCTGCGC 
GATATTGGCA AACACTTCTC CGTTAACCAG ATGATCAACA AAGAAGCGGT TAAGCAGCGT 
CTCAACCGTG AAGATCAGGG GATTTCGTTC ACTGAGTTTT CCTACAACCT GTTGCAGGGT 
TATGACTTCG CCTGTCTGAA CAAACAGTAC GGTGTGGTGC TGCAAATTGG TGGTTCTGAC 
CAGTGGGGTA ACATCACTTC TGGTATCGAC CTGACCCGTC GTCTGCATCA GAATCAGGTG 
TTTGGCCTGA CCGTTCCGCT GATCACTAAA GCAGATGGCA CCAAATTTGG TAAAACTGAA 
GGCGGCGCAG TCTGGTTGGA TCCGAAGAAA ACCAGCCCGT ACAAATTCTA CCAGTTCTGG 
ATCAACACTG CGGATGCCGA CGTTTACCGC TTCCTGAAGT TCTTCACCTT TATGAGCATT 
GAAGAGATCA ACGCCCTGGA AGAAGAAGAT AAAAACAGCG GTAAAGCACC GCGCGCCCAG 
TATGTACTGG CGGAGCAGGT GACTCGTCTG GTTCACGGTG AAGAAGGTTT ACAGGCGGCA 
AAACGTATTA CCGAATGCCT GTTCAGCGGT TCTTTGAGTG CGCTGAGTGA AGCGGACTTC 
GAACAGCTGG CGCAGGACGG CGTACCGATG GTTGAGATGG AAAAGGGCGC AGACCTGATG 
CAGGCACTGG TCGATTCTGA ACTGCAACCT TCCCGTGGTC AGGCACGTAA AACTATCGCC 
TCCAATGCCA TCACCATTAA CGGTGAAAAA CAGTCCGATC CTGAATACTT CTTTAAAGAA 
GAAGATCGTC TGTTTGGTCG TTTTACCTTA CTGCGTCGCG GTAAAAAGAA TTACTGTCTG 
ATTTGCTGGA AATAA

Protein sequence

MASSNLIKQL QERGLVAQVT DEEALAERLA QGPIALYCGF DPTADSLHLG HLVPLLCLKR 
FQQAGHKPVA LVGGATGLIG DPSFKAAERK LNTEETVQEW VDKIRKQVAP FLDFDCGENS 
AIAANNYDWF GNMNVLTFLR DIGKHFSVNQ MINKEAVKQR LNREDQGISF TEFSYNLLQG 
YDFACLNKQY GVVLQIGGSD QWGNITSGID LTRRLHQNQV FGLTVPLITK ADGTKFGKTE 
GGAVWLDPKK TSPYKFYQFW INTADADVYR FLKFFTFMSI EEINALEEED KNSGKAPRAQ 
YVLAEQVTRL VHGEEGLQAA KRITECLFSG SLSALSEADF EQLAQDGVPM VEMEKGADLM 
QALVDSELQP SRGQARKTIA SNAITINGEK QSDPEYFFKE EDRLFGRFTL LRRGKKNYCL 
ICWK