Gene EcDH1_0903 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_0903
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	968763
End bp	970064
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	51%
IMG OID
Product	RNA methyltransferase, TrmA family
Protein accession	ACX38586
Protein GI	260448164
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.000019395
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGCAAT TCTACTCTGC AAAACGACGC ACGACGACGC GTCAGATCAT AACCGTTTCA 
GTCAACGACC TCGACTCTTT TGGTCAGGGC GTGGCGCGAC ATAACGGCAA AACGCTATTT 
ATCCCCGGAT TATTGCCGCA GGAAAACGCG GAAGTTACTG TTACTGAAGA TAAAAAACAG 
TATGCCCGCG CTAAAGTCGT ACGCCGGTTA AGCGATAGCC CGGAACGCGA AACGCCACGC 
TGTCCTCATT TTGGCGTATG CGGTGGCTGT CAGCAACAAC ACGCCAGCGT GGATTTACAG 
CAGCGAAGCA AAAGTGCGGC ACTCGCCCGA TTAATGAAAC ACGATGTCTC TGAAGTGATC 
GCCGATGTTC CCTGGGGCTA TCGCCGTCGC GCGCGTTTAA GTCTGAACTA CTTACCGAAA 
ACACAGCAAC TTCAGATGGG GTTTCGCAAA GCGGGCTCCA GTGACATTGT CGACGTCAAA 
CAATGCCCCA TTTTAGCGCC CCAACTTGAA GCATTGCTGC CCAAAGTCAG GGCATGTCTG 
GGCAGCTTAC AAGCTATGCG CCATCTTGGT CATGTTGAAC TGGTACAGGC AACCAGCGGC 
ACGCTGATGA TTTTGCGCCA TACCGCACCG CTAAGTTCGG CAGATCGCGA AAAACTGGAA 
CGCTTTTCGC ATTCTGAAGG CCTGGATCTG TATCTCGCCC CCGATAGTGA GATACTCGAA 
ACCGTCTCTG GTGAGATGCC CTGGTATGAC TCAAACGGGT TGCGCTTAAC TTTTAGCCCG 
CGCGATTTTA TTCAGGTCAA TGCGGGTGTG AACCAAAAAA TGGTAGCGCG TGCGTTGGAA 
TGGCTGGATG TGCAACCTGA AGATCGCGTA CTGGATCTGT TCTGCGGTAT GGGCAACTTT 
ACACTGCCAT TGGCGACACA AGCTGCCAGT GTGGTCGGTG TAGAAGGTGT TCCGGCGCTG 
GTGGAAAAAG GCCAGCAGAA TGCGCGTCTT AATGGCTTAC AGAATGTGAC GTTTTATCAC 
GAAAATCTTG AAGAAGATGT CACAAAGCAG CCGTGGGCGA AAAACGGCTT CGATAAAGTG 
TTGCTGGACC CGGCGCGAGC AGGTGCCGCA GGTGTTATGC AGCAAATTAT AAAACTGGAA 
CCTATTCGTA TAGTTTATGT ATCCTGTAAC CCTGCAACGC TGGCTCGGGA TAGCGAAGCG 
TTATTAAAAG CAGGATATAC CATTGCGCGA CTGGCGATGC TGGATATGTT CCCACACACG 
GGACATCTGG AATCGATGGT ACTTTTCTCG CGCGTTAAAT AG

Protein sequence

MAQFYSAKRR TTTRQIITVS VNDLDSFGQG VARHNGKTLF IPGLLPQENA EVTVTEDKKQ 
YARAKVVRRL SDSPERETPR CPHFGVCGGC QQQHASVDLQ QRSKSAALAR LMKHDVSEVI 
ADVPWGYRRR ARLSLNYLPK TQQLQMGFRK AGSSDIVDVK QCPILAPQLE ALLPKVRACL 
GSLQAMRHLG HVELVQATSG TLMILRHTAP LSSADREKLE RFSHSEGLDL YLAPDSEILE 
TVSGEMPWYD SNGLRLTFSP RDFIQVNAGV NQKMVARALE WLDVQPEDRV LDLFCGMGNF 
TLPLATQAAS VVGVEGVPAL VEKGQQNARL NGLQNVTFYH ENLEEDVTKQ PWAKNGFDKV 
LLDPARAGAA GVMQQIIKLE PIRIVYVSCN PATLARDSEA LLKAGYTIAR LAMLDMFPHT 
GHLESMVLFS RVK