Gene EcDH1_1154 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1154
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	1243187
End bp	1244461
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	55%
IMG OID
Product	histidyl-tRNA synthetase
Protein accession	ACX38828
Protein GI	260448406
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.708603
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCAAAAA ACATTCAAGC CATTCGCGGC ATGAACGATT ACCTGCCTGG CGAAACGGCC 
ATCTGGCAGC GCATTGAAGG CACACTGAAA AACGTGCTCG GCAGCTACGG TTACAGTGAA 
ATCCGCTTGC CGATTGTAGA GCAGACCCCG CTATTCAAAC GTGCGATTGG TGAAGTCACC 
GACGTGGTTG AAAAAGAGAT GTACACCTTT GAGGATCGCA ATGGCGACAG CCTGACTCTG 
CGCCCTGAAG GGACGGCGGG CTGTGTACGC GCCGGCATCG AGCATGGTCT TCTGTACAAT 
CAGGAACAGC GTCTGTGGTA TATCGGGCCG ATGTTCCGTC ACGAGCGTCC GCAGAAAGGG 
CGTTATCGTC AGTTCCATCA GTTGGGCTGC GAAGTTTTCG GTCTGCAAGG TCCGGATATC 
GACGCTGAAC TGATTATGCT CACTGCCCGC TGGTGGCGCG CGCTGGGTAT TTCCGAGCAC 
GTAACTCTTG AGCTGAACTC TATCGGTTCG CTGGAAGCAC GCGCCAATTA CCGCGATGCG 
CTGGTGGCAT TCCTTGAGCA GCATAAAGAA AAGCTGGACG AAGACTGCAA ACGCCGCATG 
TACACTAACC CGCTGCGCGT GCTGGATTCA AAAAATCCGG AAGTGCAGGC GCTTCTCAAC 
GACGCTCCGG CATTAGGTGA CTATCTGGAC GAGGAATCTC GTGAGCATTT TGCCGGTCTG 
TGCAAACTGC TGGAGAGCGC GGGGATCGCT TACACCGTAA ACCAGCGTCT GGTGCGTGGT 
CTGGATTACT ACAACCGTAC CGTTTTCGAG TGGGTGACTA ACAGTCTCGG CTCCCAGGGC 
ACCGTGTGTG CAGGCGGTCG TTATGACGGT CTTGTGGAAC AACTGGGCGG TCGTGCAACA 
CCGGCTGTCG GTTTTGCTAT GGGCCTCGAA CGTCTTGTAT TGTTAGTACA GGCCGTTAAT 
CCGGAATTTA AAGCCGATCC TGTTGTCGAT ATATACCTGG TGGCTTCAGG TGCTGATACA 
CAATCTGCGG CTATGGCATT AGCTGAGCGT CTGCGTGATG AATTACCGGG CGTGAAATTG 
ATGACCAACC ACGGCGGCGG CAACTTTAAG AAACAGTTTG CCCGTGCTGA TAAATGGGGT 
GCCCGCGTTG CTGTGGTGCT GGGTGAGTCT GAAGTGGCTA ACGGCACAGC AGTAGTGAAG 
GATTTGCGCT CTGGTGAGCA AACGGCAGTT GCGCAGGATA GCGTAGCCGC GCATTTGCGC 
ACGTTACTGG GTTAA

Protein sequence

MAKNIQAIRG MNDYLPGETA IWQRIEGTLK NVLGSYGYSE IRLPIVEQTP LFKRAIGEVT 
DVVEKEMYTF EDRNGDSLTL RPEGTAGCVR AGIEHGLLYN QEQRLWYIGP MFRHERPQKG 
RYRQFHQLGC EVFGLQGPDI DAELIMLTAR WWRALGISEH VTLELNSIGS LEARANYRDA 
LVAFLEQHKE KLDEDCKRRM YTNPLRVLDS KNPEVQALLN DAPALGDYLD EESREHFAGL 
CKLLESAGIA YTVNQRLVRG LDYYNRTVFE WVTNSLGSQG TVCAGGRYDG LVEQLGGRAT 
PAVGFAMGLE RLVLLVQAVN PEFKADPVVD IYLVASGADT QSAAMALAER LRDELPGVKL 
MTNHGGGNFK KQFARADKWG ARVAVVLGES EVANGTAVVK DLRSGEQTAV AQDSVAAHLR 
TLLG