Gene ECD_04072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_04072
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	4334549
End bp	4336621
Gene Length	2073 bp
Protein Length	690 aa
Translation table	11
GC content	52%
IMG OID
Product	putative oxidoreductase
Protein accession	ACT45861
Protein GI	253980191
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCAGC TTGATGACAC CATCCTTGAT GCGCTGACGC ACGTTACTTT CCCAAAGGGT 
TTTGCACAGG CAGAGCCCGC ATGGGTTGTC ACGGTAGACG GTGTTGATTA CCCACTCTGG 
CAAACAGATG CCCTGGTAGT CGGCAGTGGT GCAGCCGGGC TGCGTGCAGC TGTGGAACTT 
AAACGCCGCC AGCAAAATGT GCTGATCGCC ACTGCCGGGT TATATATGGG GACGTCGGCA 
TGTTCTGGTT CCGATAAACA GACACTGTTT ACCGCCGCTA CCGCGGGCAA CGGCGACAAC 
TTCACCAAAC TGGCAGAGGC ACTGGCGAGC GGTGGGGCGA TGGATCACGA CACCGCTTAT 
GTCGAAGCGG TAGGTTCTCT GCACACTCTT GGCGGGTTGC AATATCTTGG TCTGGAATTA 
CCGGAAGATC GCTATGGCGC GATTCTTCGT TATCAAACCG ACCATGACGA AGCCGGGCGT 
GCAACCTCGT GTGGGCCGCG GACCTCAAGG TTAATGGTGA AAGTGCTGTT GGAAGAAGTA 
CAGCGCCTCG CCATTCCAGT GTTGACCAGT GCAACAGTGA TTAAACTGCT GCATCAGCGT 
GACGAAAACG GCGAAGACCG TGTGGCGGGG GCAATCCTCG CGACCGGTCA TCGCGCCCAT 
AACCCTTGGG GGCTGGCAAT TGTGACTGCG CCCAATGTGG TACTGGCAAC AGGAGGGCCT 
GGCGAGCTTT ATCGCGACAG TGTGTACCCA CACAAATGTT TTGGCTCGCT GGGGCTGGCG 
CTGGAGGAAG GCCTGACGCT AACCAATCTG ACCGAAAGCC AGTTTGGTAT AGGCACGCCG 
CGCAGCACGT TTCCGTGGAA TTTATCCGGC ACCTATGTAC AGGTGATCCC GTATATCTAT 
TCCGTGGATG CTGAGGGTAA CGAGTATAAC TTCCTCGCGG ATTACTATCG CACCACCCAG 
GAGCTGGCTT CAAACATTTT CCGTAAAGGC TATCAGTGGC CGTTCCACGC CACTCGGGTG 
ATGGATTTTG GCTCCAGCTT GTTAGATATG GCAGTAGCGC AAGAGCAGCA ATCAGGGCGT 
CAGGTATTTA TGGATTTCAA TCGCAATCCT GAACCTGTGC CGGGTGACCT GCCATTCTCA 
TTAGAGCGAC TGGACGACGA CGTTCGCGCG TATCTGGAAA ATAACGACGC TCTGGCACCA 
TCGCCCATCG AACGACTGCA ACGAATGAAT CCGCTGTCTA TCTCGCTGTA TAAGATGCAC 
GGTTACGATC TCACCACGCA GCCATTGCAG TTTGCCATGA ATAATCAGCA TATGAATGGC 
GGCATTGAAG TGGATATCTG GGGACAAACA TCCCTGCCCG GTTGTTTTGC CGTGGGGGAA 
GTTGCTGGCA CACACGGCGT CACTCGCCCT GGTGGTGCGG CATTGAATGC CGGGCAGGTT 
TTTGCTGTTC GTCTGGCACG TTTTATTGGT TGCACGCAAA AACGTAATAT TGATGGAGAT 
ATAGCACAGC TGGTAGCTCA GGCACTGGCT TCTATAAGAG AGATCATTAC TCAGGCGCAC 
GATAACGGGA CCGGGATGCC GTTGTCGGTT GTGAGAGAAA AAATTCAGGC ACGAATGTCT 
GACCATGCGG GATTTATTTG CCATGCCGAT AAAGTCCGAC GCGCCACTCG TGATGCCCTG 
CTATTGAACG AATTTGTCCA ACGGCATGGA TTGGCTATCA AACATGTGGG CGAAGTTGCC 
GAGCTGTTTA TGTGGCGGCA TATGGCGCTG ACCTCTGCCG CCGTCTTAAC TCAACTGACA 
CATTATATTG ATGCTGGTGG TGGCAGTCGT GGGGCACGGA TAGTTATTGA TCCACAAGGC 
AAATGCCTAC CACAAACTCG TCGCGGCGCA AAAGAAGAAT GGCGTTTTCG CTCTGAACGT 
GCTGAAGACA AAAATCACAG ATTAACGATT CAATATTCGC AAGGTTCTTT TATTACCGAA 
GTGAAGTCTT TACGTATGCA ACCGTGTATT AACGGTATTT ACTTTGAAAA AAACTGGCCA 
GACTTTTTAA ATGGAGAAAT TTACACACAA TAA

Protein sequence

MSQLDDTILD ALTHVTFPKG FAQAEPAWVV TVDGVDYPLW QTDALVVGSG AAGLRAAVEL 
KRRQQNVLIA TAGLYMGTSA CSGSDKQTLF TAATAGNGDN FTKLAEALAS GGAMDHDTAY 
VEAVGSLHTL GGLQYLGLEL PEDRYGAILR YQTDHDEAGR ATSCGPRTSR LMVKVLLEEV 
QRLAIPVLTS ATVIKLLHQR DENGEDRVAG AILATGHRAH NPWGLAIVTA PNVVLATGGP 
GELYRDSVYP HKCFGSLGLA LEEGLTLTNL TESQFGIGTP RSTFPWNLSG TYVQVIPYIY 
SVDAEGNEYN FLADYYRTTQ ELASNIFRKG YQWPFHATRV MDFGSSLLDM AVAQEQQSGR 
QVFMDFNRNP EPVPGDLPFS LERLDDDVRA YLENNDALAP SPIERLQRMN PLSISLYKMH 
GYDLTTQPLQ FAMNNQHMNG GIEVDIWGQT SLPGCFAVGE VAGTHGVTRP GGAALNAGQV 
FAVRLARFIG CTQKRNIDGD IAQLVAQALA SIREIITQAH DNGTGMPLSV VREKIQARMS 
DHAGFICHAD KVRRATRDAL LLNEFVQRHG LAIKHVGEVA ELFMWRHMAL TSAAVLTQLT 
HYIDAGGGSR GARIVIDPQG KCLPQTRRGA KEEWRFRSER AEDKNHRLTI QYSQGSFITE 
VKSLRMQPCI NGIYFEKNWP DFLNGEIYTQ