Gene B21_00305 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_00305
Symbol	mhpA
ID	8114223
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	338046
End bp	339710
Gene Length	1665 bp
Protein Length	554 aa
Translation table	11
GC content	57%
IMG OID	644846591
Product	hypothetical protein
Protein accession	YP_002998164
Protein GI	251783860
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism
COG ID	[COG0654] 2-polyprenyl-6-methoxyphenol hydroxylase and related FAD-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00161031
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAATAC AACACCCTGA CATCCAGCCT GCTGTTAACC ATAGCGTTCA GGTGGCGATC 
GCTGGTGCCG GCCCGGTTGG GCTGATGATG GCGAACTATC TCGGCCAGAT GGGCATTGAC 
GTGCTGGTGG TGGAGAAACT CGATAAGTTG ATCGACTACC CGCGTGCGAT TGGTATTGAT 
GACGAGGCGC TGCGCACCAT GCAGTCGGTC GGCCTGGTCG ATGATGTTCT GCCGCACACT 
ACGCCGTGGC ACGCGATGCG TTTTCTCACC CCGAAAGGCC GCTGTTTTGC TGATATTCAG 
CCAATGACCG ATGAATTTGG CTGGCCGCGC CGTAACGCCT TTATTCAGCC GCAGGTCGAT 
GCGGTGATGC TGGAAGGGGT GTCGCGTTTT CCGAATGTGC GCTGCTTGTT TTCCCGCGAG 
CTGGAGGCCT TCAGTCAGCA AGATGACGAA GTGACCTTGC ACCTGAAAAC GGCAGAAGGG 
CAGCGGGAAA TAGTCAAAGC CCAGTGGCTG GTGGCCTGTG ATGGTGGGGC AAGTTTTGTC 
CGTCGCACCC TGAATGTGCC GTTTGAAGGT AAAACTGCGC CAAATCAGTG GATTGTGGTA 
GATATCGCCA ACGATCCGTT AAGTACGCCG CATATCTATT TGTGTTGCGA TCCGGTGCGC 
CCGTATGTTT CTGCCGCGCT ACCTCATGCG GTACGTCGCT TTGAATTTAT GGTGATGCCA 
GGAGAAACCG AAGAACAGCT GCGTGAGCCG CAAAATATGC GCAAGCTGTT AAGCAAAGTG 
CTGCCTAATC CGGACAATGT TGAATTGATT CGCCAGCGTG TCTACACCCA CAACGCGCGA 
CTGGCGCAAC GTTTCCGTAT TGATCGCGTA CTGCTGGCGG GCGATGCCGC GCACATCATG 
CCGGTATGGC AGGGGCAGGG CTATAACAGC GGTATGCGCG ACGCCTTTAA CCTCGCCTGG 
AAACTGGCGT TGGTTATCCA GGGGAAAGCC CGTGATGCGC TGCTCGATAC CTATCAACAA 
GAACGACGCG ATCACGCCAA AGCGATGATT GACCTGTCCG TGACGGCGGG CAACGTGCTG 
GCTCCGCCGA AACGCTGGCA GGGTACGTTA CGTGACGGCG TTTCCTGGCT GTTGAATTAT 
CTGCCGCCAG TAAAACGCTA CTTCCTCGAA ATGCGCTTCA AGCCGATGCC GCAATATTAC 
GGCGGTGCGC TGGTGCGAGA GGGCGAAGCG AAGCACTCTC CGGTCGGCAA GATGTTTATT 
CAGCCGAAAG TCACGCTGGA AAACGGCGAC GTGACGCTGC TCGATAACGC GATCGGCGCG 
AACTTCGCGG TAATTGGCTG GGGATGCAAT CCACTGTGGG GGATGAGCGA CGAGCAAATC 
CAGCAGTGGC GCGCGTTGGG CACCCGCTTC ATTCAGGTGG TGCCGGAAGT GCAAATTCAT 
ACCGCACAGG ATAACCACGA CGGCGTACTA CGCGTGGGGG ATACGCAAGG TCGCCTGCGT 
AGCTGGTTCG CACAACATAA TGCTTCGCTG GTGGTGATGC GCCCGGATCG CTTTGTTGCC 
GCCACCGCCA TTCCGCAAAC CCTGGGTAAT ACGCTGAATA AACTGGCGTC GGTGATGACG 
CTGACCCGCC CTGATGCCGA CGTTTCTGTC GAAAAGGTAG CCTGA

Protein sequence

MAIQHPDIQP AVNHSVQVAI AGAGPVGLMM ANYLGQMGID VLVVEKLDKL IDYPRAIGID 
DEALRTMQSV GLVDDVLPHT TPWHAMRFLT PKGRCFADIQ PMTDEFGWPR RNAFIQPQVD 
AVMLEGVSRF PNVRCLFSRE LEAFSQQDDE VTLHLKTAEG QREIVKAQWL VACDGGASFV 
RRTLNVPFEG KTAPNQWIVV DIANDPLSTP HIYLCCDPVR PYVSAALPHA VRRFEFMVMP 
GETEEQLREP QNMRKLLSKV LPNPDNVELI RQRVYTHNAR LAQRFRIDRV LLAGDAAHIM 
PVWQGQGYNS GMRDAFNLAW KLALVIQGKA RDALLDTYQQ ERRDHAKAMI DLSVTAGNVL 
APPKRWQGTL RDGVSWLLNY LPPVKRYFLE MRFKPMPQYY GGALVREGEA KHSPVGKMFI 
QPKVTLENGD VTLLDNAIGA NFAVIGWGCN PLWGMSDEQI QQWRALGTRF IQVVPEVQIH 
TAQDNHDGVL RVGDTQGRLR SWFAQHNASL VVMRPDRFVA ATAIPQTLGN TLNKLASVMT 
LTRPDADVSV EKVA