Gene ECD_01020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_01020
Symbol	ycdO
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	1086526
End bp	1087653
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	51%
IMG OID
Product	hypothetical protein
Protein accession	ACT42915
Protein GI	253977245
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.154697
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCATTA ACTTCCGCCG TAACGCATTG CAGTTGAGCG TGGCTGCGCT GTTTTCTTCT 
GCTTTTATGG CTAACGCCGC TGATGTGCCG CAGGTCAAAG TGACCGTGAC GGATAAGCAG 
TGCGAACCGA TGACCATTAC GGTTAACGCC GGGAAAACAC AGTTCATTAT TCAGAACCAC 
AGCCAGAAGG CGCTGGAGTG GGAGATCCTC AAAGGCGTGA TGGTGGTGGA AGAGCGGGAA 
AATATCGCCC CTGGCTTTAG CCAGAAAATG ACGGCGAATT TACAGCCTGG CGAATACGAT 
ATGACCTGCG GTCTGCTGAC TAACCCGAAA GGGAAGTTGA TCGTCAAAGG TGAGGCAACG 
GCGGATGCGG CGCAAAGTGA TGCGCTGTTA AGTCTTGGTG GTGCAATTAC TGCATATAAA 
GCGTATGTCA TGGCGGAAAC CACGCAGCTG GTGACCGACA CCAAAGCCTT TACCGACGCG 
ATTAAAGCAG GCGATATCGA AAAAGCGAAA GCACTGTATG CACCGACGCG CCAGCACTAT 
GAGCGTATTG AACCGATTGC TGAACTGTTC TCCGATCTGG ATGGCAGCAT TGACGCCCGT 
GAAGATGATT ACGAGCAAAA AGCCGCCGAC CCAAAATTCA CTGGTTTCCA CCGTCTGGAA 
AAAGCATTGT TTGGCGACAA CACCACCAAA GGGATGGATC AGTACGCTGA GCAGCTTTAT 
ACCGATGTGG TCGATTTGCA AAAACGCATC AGTGAACTGG CTTTCCCACC TTCAAAAGTG 
GTCGGCGGCG CAGCCGGACT GATTGAGGAA GTGGCAGCCA GCAAAATTAG CGGTGAAGAA 
GATCGCTACA GCCACACCGA TCTGTGGGAT TTCCAGGCTA ACGTTGAAGG CTCGCAGAAA 
ATTGTCGATT TGCTGCGTCC ACAACTGCAA AAAGCCAACC CGGAACTGCT GGCAAAAGTC 
GATGCCAACT TTAAAAAGGT CGATACCATT CTGGCGAAAT ACCGTACTAA AGACGGTTTT 
GAAACCTACG ACAAATTGAC CGATGCCGAC CGGAATGCAC TGAAAGGACC GATTACTGCG 
CTGGCGGAAG ATCTGGCGCA ACTTCGCGGT GTGCTGGGAC TGGATTAA

Protein sequence

MTINFRRNAL QLSVAALFSS AFMANAADVP QVKVTVTDKQ CEPMTITVNA GKTQFIIQNH 
SQKALEWEIL KGVMVVEERE NIAPGFSQKM TANLQPGEYD MTCGLLTNPK GKLIVKGEAT 
ADAAQSDALL SLGGAITAYK AYVMAETTQL VTDTKAFTDA IKAGDIEKAK ALYAPTRQHY 
ERIEPIAELF SDLDGSIDAR EDDYEQKAAD PKFTGFHRLE KALFGDNTTK GMDQYAEQLY 
TDVVDLQKRI SELAFPPSKV VGGAAGLIEE VAASKISGEE DRYSHTDLWD FQANVEGSQK 
IVDLLRPQLQ KANPELLAKV DANFKKVDTI LAKYRTKDGF ETYDKLTDAD RNALKGPITA 
LAEDLAQLRG VLGLD