Gene ECD_03092 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_03092
Symbol	yhcM
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	3240033
End bp	3241160
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	52%
IMG OID
Product	conserved protein with nucleoside triphosphate hydrolase domain
Protein accession	ACT44896
Protein GI	253979226
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00364755
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAGCG TTACCCCAAC ATCGCAATAC CTGAAGGCGC TCAATGAAGG CAGCCATCAA 
CCCGACGACG TTCAAAAAGA GGCCGTCAGC CGCCTGGAAA TTATTTATCA AGAACTCATC 
AATAGCAGGC CACCAGCCCC CAGGACGAGT GGGCTAATGG CGCGGGTCGG TAAGCTGTGG 
GGTAAACGCG AAGACACAAA GCATACGCCA GTGCGTGGCT TATATATGTG GGGCGGTGTA 
GGACGCGGGA AAACCTGGCT GATGGACCTT TTCTATCAAA GCCTGCCGGG AGAGCGGAAA 
CAGCGCCTGC ACTTTCACCG TTTTATGCTG CGGGTGCACG AAGAGCTAAC TGCCTTACAG 
GGGCAGACCG ATCCGCTGGA AATTATTGCC GATCGCTTTA AAGCCGAAAC TGACGTGCTC 
TGTTTTGACG AATTTTTTGT TTCTGATATT ACCGACGCCA TGCTACTTGG CGGTCTGATG 
AAAGCCCTGT TCACCCGCGG TATTACCCTG GTTGCGACGT CAAATATTCC GCCGGACGAA 
CTTTATCGAA ATGGCCTGCA ACGTGCGCGT TTTCTGCCTG CAATCGATGC CATTAAACAG 
CATTGTGATG TAATGAACGT GGACGCTGGT GTTGATTATC GACTGCGTAC ACTCACTCAG 
GCGCATCTGT GGCTTTCGCC ACTCAACGAT GAAACCCGGG CGCAGATGGA TAAACTATGG 
TTGGCGCTGG CGGGGGCGAA ACGAGAAAAT TCACCGACGT TAGAAATCAA CCATCGGCCA 
TTGGCGACAA TGGGCGTCGA GAACCAGACG CTGGCGGTCT CTTTTACTAC GCTGTGCGTC 
GACGCCCGCA GTCAGCATGA CTATATTGCG CTCTCACGTC TCTTTCATAC GGTCATGTTG 
TTTGATGTAC CAGTTATGAC GCGGTTGATG GAGAGCGAAG CGCGGCGCTT TATTGCGCTG 
GTGGATGAGT TTTACGAGCG CCATGTCAAA TTAGTGGTGA GTGCAGAAGT GCCGCTGTAT 
GCAATTTATC AGGGCGAGCG GCTGAAATTT GAGTTCCAGC GTTGCCTGTC ACGTCTGCAA 
GAGATGCAAA GCGAAGAGTA TCTGAAGCGC GAGCATTTAG CAGGTTAA

Protein sequence

MQSVTPTSQY LKALNEGSHQ PDDVQKEAVS RLEIIYQELI NSRPPAPRTS GLMARVGKLW 
GKREDTKHTP VRGLYMWGGV GRGKTWLMDL FYQSLPGERK QRLHFHRFML RVHEELTALQ 
GQTDPLEIIA DRFKAETDVL CFDEFFVSDI TDAMLLGGLM KALFTRGITL VATSNIPPDE 
LYRNGLQRAR FLPAIDAIKQ HCDVMNVDAG VDYRLRTLTQ AHLWLSPLND ETRAQMDKLW 
LALAGAKREN SPTLEINHRP LATMGVENQT LAVSFTTLCV DARSQHDYIA LSRLFHTVML 
FDVPVMTRLM ESEARRFIAL VDEFYERHVK LVVSAEVPLY AIYQGERLKF EFQRCLSRLQ 
EMQSEEYLKR EHLAG