Gene EcDH1_2003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_2003
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	2161256
End bp	2162530
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	52%
IMG OID
Product	tyrosyl-tRNA synthetase
Protein accession	ACX39660
Protein GI	260449238
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.00229572
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAGCA GTAACTTGAT TAAACAATTG CAAGAGCGGG GGCTGGTAGC CCAGGTGACG 
GACGAGGAAG CGTTAGCAGA GCGACTGGCG CAAGGCCCGA TCGCGCTCTA TTGCGGCTTC 
GATCCTACCG CTGACAGCTT GCATTTGGGG CATCTTGTTC CATTGTTATG CCTGAAACGC 
TTCCAGCAGG CGGGCCACAA GCCGGTTGCG CTGGTAGGCG GCGCGACGGG TCTGATTGGC 
GACCCGAGCT TCAAAGCTGC CGAGCGTAAG CTGAACACCG AAGAAACTGT TCAGGAGTGG 
GTGGACAAAA TCCGTAAGCA GGTTGCCCCG TTCCTCGATT TCGACTGTGG AGAAAACTCT 
GCTATCGCGG CGAACAACTA TGACTGGTTC GGCAATATGA ATGTGCTGAC CTTCCTGCGC 
GATATTGGCA AACACTTCTC CGTTAACCAG ATGATCAACA AAGAAGCGGT TAAGCAGCGT 
CTCAACCGTG AAGATCAGGG GATTTCGTTC ACTGAGTTTT CCTACAACCT GTTGCAGGGT 
TATGACTTCG CCTGTCTGAA CAAACAGTAC GGTGTGGTGC TGCAAATTGG TGGTTCTGAC 
CAGTGGGGTA ACATCACTTC TGGTATCGAC CTGACCCGTC GTCTGCATCA GAATCAGGTG 
TTTGGCCTGA CCGTTCCGCT GATCACTAAA GCAGATGGCA CCAAATTTGG TAAAACTGAA 
GGCGGCGCAG TCTGGTTGGA TCCGAAGAAA ACCAGCCCGT ACAAATTCTA CCAGTTCTGG 
ATCAACACTG CGGATGCCGA CGTTTACCGC TTCCTGAAGT TCTTCACCTT TATGAGCATT 
GAAGAGATCA ACGCCCTGGA AGAAGAAGAT AAAAACAGCG GTAAAGCACC GCGCGCCCAG 
TATGTACTGG CGGAGCAGGT GACTCGTCTG GTTCACGGTG AAGAAGGTTT ACAGGCGGCA 
AAACGTATTA CCGAATGCCT GTTCAGCGGT TCTTTGAGTG CGCTGAGTGA AGCGGACTTC 
GAACAGCTGG CGCAGGACGG CGTACCGATG GTTGAGATGG AAAAGGGCGC AGACCTGATG 
CAGGCACTGG TCGATTCTGA ACTGCAACCT TCCCGTGGTC AGGCACGTAA AACTATCGCC 
TCCAATGCCA TCACCATTAA CGGTGAAAAA CAGTCCGATC CTGAATACTT CTTTAAAGAA 
GAAGATCGTC TGTTTGGTCG TTTTACCTTA CTGCGTCGCG GTAAAAAGAA TTACTGTCTG 
ATTTGCTGGA AATAA

Protein sequence

MASSNLIKQL QERGLVAQVT DEEALAERLA QGPIALYCGF DPTADSLHLG HLVPLLCLKR 
FQQAGHKPVA LVGGATGLIG DPSFKAAERK LNTEETVQEW VDKIRKQVAP FLDFDCGENS 
AIAANNYDWF GNMNVLTFLR DIGKHFSVNQ MINKEAVKQR LNREDQGISF TEFSYNLLQG 
YDFACLNKQY GVVLQIGGSD QWGNITSGID LTRRLHQNQV FGLTVPLITK ADGTKFGKTE 
GGAVWLDPKK TSPYKFYQFW INTADADVYR FLKFFTFMSI EEINALEEED KNSGKAPRAQ 
YVLAEQVTRL VHGEEGLQAA KRITECLFSG SLSALSEADF EQLAQDGVPM VEMEKGADLM 
QALVDSELQP SRGQARKTIA SNAITINGEK QSDPEYFFKE EDRLFGRFTL LRRGKKNYCL 
ICWK