Gene ECD_02851 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_02851
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	2990792
End bp	2992522
Gene Length	1731 bp
Protein Length	576 aa
Translation table	11
GC content	53%
IMG OID
Product	putative saframycin Mx1 synthetase B
Protein accession	ACT44655
Protein GI	253978985
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000692091
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGTGTATA TGTCTAATAA AATCTTTACG CATTCCCTAC CTATGCGCTA TGCCGATTTT 
CCAACGCTTG TTGATGCTTT GGACTACGCC GCTCTGAGTA GCGCCGGAAT GAATTTTTAT 
GACAGACGTT GCCAACTTGA AGATCAACTG GAATATCAGA CGTTAAAAGC ACGTGCCGAA 
GCTGGTGCGA AGCGGTTGTT ATCGCTGAAC CTGAAAAAAG GCGATCGCGT GGCACTGATT 
GCCGAAACAA GTAGCGAGTT CGTAGAGGCT TTTTTTGCCT GCCAGTATGC CGGCTTAGTC 
GCCGTCCCGT TGGCGATTCC AATGGGCGTT GGTCAGCGGG ATTCCTGGAG CGCCAAATTG 
CAGGGTTTAC TGGCAAGTTG CCAGCCCGCA GCCATTATCA CTGGTGATGA GTGGTTGCCA 
CTGGTCAATG CCGCGACGCA TGACAACCCC GAATTACATG TTTTAAGCCA CGCTTGGTTT 
AAGGCATTAT CGGAAGCCGA TGTTGCGCTC CAGCGTCCAG TTCCGAACGA TATCGCCTAC 
CTCCAGTACA CCTCCGGCAG CACCCGTTTT CCCCGTGGCG TCATTATCAC CCATCGCGAA 
GTGATGGCTA ATCTACGTGC TATAAGCCAC GACGGCATTA AATTACGCCC TGGCGACCGC 
TGCGCCTCCT GGCTGCCTTT CTACCATGAT ATGGGACTGG TCGGCTTTCT CCTGACCCCC 
GTCGCCACGC AGCTTTCAGT AGATTATTTG CGCACTCAGG ATTTTGCCAT GCGTCCTCTG 
CAATGGCTTA AATTGATCAG TAAAAATCGC GGCACCGTTT CCGTTGCGCC GCCGTTTGGC 
TATGAATTGT GCCAGCGCCG CGTGAATGAA AAAGATCTCG CTGAACTGGA TCTTTCCTGC 
TGGCGCGTCG CTGGTATTGG TGCAGAACCC ATCTCCGCAG AACAACTCCA TCAATTCGCT 
GAATGTTTCC GTCAGGTTAA CTTTGACAAT AAAACTTTCA TGCCGTGCTA CGGACTGGCA 
GAAAATGCGC TGGCTGTCAG CTTCTCTGAT GAAGCCTCCG GGGTTGTGGT TAACGAAGTG 
GATCGCGACA TCCTCGAATA TCAGGGTAAA GCCGTCGCGC CGGGTGCAGA GACACGCGCC 
GTATCGACTT TCGTCAACTG CGGCAAAGCG TTGCCGGAAC ATGGTATTGA AATCCGCAAT 
GAAGCAGGTA TGCCGGTCGC GGAACGTGTG GTAGGCCATA TTTGCATCTC CGGTCCCAGT 
CTGATGAGCG GTTACTTTGG CGACCAGGTT TCGCAAGACG AGATTGCCGC GACGGGCTGG 
TTAGACACCG GCGACCTCGG TTATCTGCTG GACGGTTATC TGTATGTCAC CGGACGCATT 
AAAGATCTGA TTATTATTCG TGGCCGTAAT ATCTGGCCGC AGGATATTGA ATATATAGCG 
GAACAGGAAC CGGAAATTCA TTCTGGCGAT GCGATTGCTT TTGTTACCGC CCAGGAAAAA 
ATCATTTTGC AGATCCAGTG TCGGATCAGC GACGAAGAAC GTCGCGGGCA GCTTATCCAC 
GCGCTGGCGG CACGGATCCA AAGCGAATTT GGCGTGACCG CGGCTATCGC TCTGTTGCCG 
CCCCACAGTA TTCCCCGAAC GTCCTCCGGC AAGCCTGCCC GTGCGGAAGC GAAAAAACGT 
TATCAGAAGG CTTATGCTGC CAGTCTTAAT GTGCAGGAAT CCCTGGCATG A

Protein sequence

MVYMSNKIFT HSLPMRYADF PTLVDALDYA ALSSAGMNFY DRRCQLEDQL EYQTLKARAE 
AGAKRLLSLN LKKGDRVALI AETSSEFVEA FFACQYAGLV AVPLAIPMGV GQRDSWSAKL 
QGLLASCQPA AIITGDEWLP LVNAATHDNP ELHVLSHAWF KALSEADVAL QRPVPNDIAY 
LQYTSGSTRF PRGVIITHRE VMANLRAISH DGIKLRPGDR CASWLPFYHD MGLVGFLLTP 
VATQLSVDYL RTQDFAMRPL QWLKLISKNR GTVSVAPPFG YELCQRRVNE KDLAELDLSC 
WRVAGIGAEP ISAEQLHQFA ECFRQVNFDN KTFMPCYGLA ENALAVSFSD EASGVVVNEV 
DRDILEYQGK AVAPGAETRA VSTFVNCGKA LPEHGIEIRN EAGMPVAERV VGHICISGPS 
LMSGYFGDQV SQDEIAATGW LDTGDLGYLL DGYLYVTGRI KDLIIIRGRN IWPQDIEYIA 
EQEPEIHSGD AIAFVTAQEK IILQIQCRIS DEERRGQLIH ALAARIQSEF GVTAAIALLP 
PHSIPRTSSG KPARAEAKKR YQKAYAASLN VQESLA