Gene B21_03043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03043
Symbol	yhcM
ID	8115217
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	3239240
End bp	3240367
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	52%
IMG OID	644849228
Product	hypothetical protein
Protein accession	YP_003000801
Protein GI	251786497
COG category	[R] General function prediction only
COG ID	[COG1485] Predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00168064
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAGCG TTACCCCAAC ATCGCAATAC CTGAAGGCGC TCAATGAAGG CAGCCATCAA 
CCCGACGACG TTCAAAAAGA GGCCGTCAGC CGCCTGGAAA TTATTTATCA AGAACTCATC 
AATAGCAGGC CACCAGCCCC CAGGACGAGT GGGCTAATGG CGCGGGTCGG TAAGCTGTGG 
GGTAAACGCG AAGACACAAA GCATACGCCA GTGCGTGGCT TATATATGTG GGGCGGTGTA 
GGACGCGGGA AAACCTGGCT GATGGACCTT TTCTATCAAA GCCTGCCGGG AGAGCGGAAA 
CAGCGCCTGC ACTTTCACCG TTTTATGCTG CGGGTGCACG AAGAGCTAAC TGCCTTACAG 
GGGCAGACCG ATCCGCTGGA AATTATTGCC GATCGCTTTA AAGCCGAAAC TGACGTGCTC 
TGTTTTGACG AATTTTTTGT TTCTGATATT ACCGACGCCA TGCTACTTGG CGGTCTGATG 
AAAGCCCTGT TCACCCGCGG TATTACCCTG GTTGCGACGT CAAATATTCC GCCGGACGAA 
CTTTATCGAA ATGGCCTGCA ACGTGCGCGT TTTCTGCCTG CAATCGATGC CATTAAACAG 
CATTGTGATG TAATGAACGT GGACGCTGGT GTTGATTATC GACTGCGTAC ACTCACTCAG 
GCGCATCTGT GGCTTTCGCC ACTCAACGAT GAAACCCGGG CGCAGATGGA TAAACTATGG 
TTGGCGCTGG CGGGGGCGAA ACGAGAAAAT TCACCGACGT TAGAAATCAA CCATCGGCCA 
TTGGCGACAA TGGGCGTCGA GAACCAGACG CTGGCGGTCT CTTTTACTAC GCTGTGCGTC 
GACGCCCGCA GTCAGCATGA CTATATTGCG CTCTCACGTC TCTTTCATAC GGTCATGTTG 
TTTGATGTAC CAGTTATGAC GCGGTTGATG GAGAGCGAAG CGCGGCGCTT TATTGCGCTG 
GTGGATGAGT TTTACGAGCG CCATGTCAAA TTAGTGGTGA GTGCAGAAGT GCCGCTGTAT 
GCAATTTATC AGGGCGAGCG GCTGAAATTT GAGTTCCAGC GTTGCCTGTC ACGTCTGCAA 
GAGATGCAAA GCGAAGAGTA TCTGAAGCGC GAGCATTTAG CAGGTTAA

Protein sequence

MQSVTPTSQY LKALNEGSHQ PDDVQKEAVS RLEIIYQELI NSRPPAPRTS GLMARVGKLW 
GKREDTKHTP VRGLYMWGGV GRGKTWLMDL FYQSLPGERK QRLHFHRFML RVHEELTALQ 
GQTDPLEIIA DRFKAETDVL CFDEFFVSDI TDAMLLGGLM KALFTRGITL VATSNIPPDE 
LYRNGLQRAR FLPAIDAIKQ HCDVMNVDAG VDYRLRTLTQ AHLWLSPLND ETRAQMDKLW 
LALAGAKREN SPTLEINHRP LATMGVENQT LAVSFTTLCV DARSQHDYIA LSRLFHTVML 
FDVPVMTRLM ESEARRFIAL VDEFYERHVK LVVSAEVPLY AIYQGERLKF EFQRCLSRLQ 
EMQSEEYLKR EHLAG