Gene EcDH1_2587 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_2587
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	2759153
End bp	2760271
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	52%
IMG OID
Product	Sarcosine oxidase
Protein accession	ACX40223
Protein GI	260449801
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATACG ATCTCATCAT TATTGGCAGC GGTTCCGTAG GCGCTGCCGC CGGGTATTAT 
GCAACCCGCG CCGGTTTAAA CGTGCTAATG ACCGACGCCC ATATGCCACC GCATCAACAC 
GGCAGCCACC ACGGCGATAC GCGATTAATT CGCCATGCTT ATGGTGAAGG CGAAAAGTAT 
GTCCCGCTGG TCCTCCGCGC GCAAACGCTG TGGGATGAAC TCTCCCGCCA CAACGAAGAA 
GATCCCATTT TTGTACGCTC TGGCGTCATT AACCTTGGCC CGGCTGATTC CACATTTCTC 
GCCAACGTCG CCCACAGCGC CGAACAATGG CAACTCAACG TTGAAAAGCT CGATGCGCAA 
GGGATTATGG CCCGCTGGCC GGAAATACGC GTCCCGGACA ACTACATCGG CTTATTTGAA 
ACTGATTCCG GTTTTTTGCG CAGCGAACTG GCGATTAAAA CCTGGATCCA ACTGGCGAAG 
GAAGCGGGCT GTGCGCAACT GTTCAACTGC CCGGTCACCG CAATTCGTCA TGACGATGAT 
GGCGTAACTA TTGAAACGGC TGACGGTGAG TATCAGGCGA AAAAAGCGAT TGTCTGCGCG 
GGAACATGGG TAAAAGACCT GCTCCCGGAG CTGCCTGTCC AGCCCGTACG CAAAGTATTT 
GCCTGGTATC AGGCCGATGG CCGCTATAGC GTGAAGAATA AATTCCCGGC GTTTACCGGT 
GAACTGCCCA ATGGCGATCA ATATTATGGT TTTCCGGCAG AAAACGACGC GTTGAAGATT 
GGCAAACATA ACGGAGGCCA GGTTATCCAT TCAGCGGATG AACGTGTTCC GTTTGCGGAA 
GTGGCCAGTG ATGGGTCAGA AGCCTTCCCG TTCTTGCGCA ATGTATTGCC GGGTATCGGT 
TGCTGCCTGT ACGGCGCTGC CTGCACCTAT GATAATTCGC CTGACGAAGA TTTTATTATC 
GATACCCTAC CCGGCCACGA TAATACACTG CTCATTACCG GCCTGAGTGG GCACGGTTTT 
AAATTTGCGT CAGTTTTAGG GGAAATAGCT GCCGATTTTG CGCAAGACAA AAAAAGCGAT 
TTTGATTTGA CGCCATTCAG GCTTTCCCGC TTCCAATAA

Protein sequence

MKYDLIIIGS GSVGAAAGYY ATRAGLNVLM TDAHMPPHQH GSHHGDTRLI RHAYGEGEKY 
VPLVLRAQTL WDELSRHNEE DPIFVRSGVI NLGPADSTFL ANVAHSAEQW QLNVEKLDAQ 
GIMARWPEIR VPDNYIGLFE TDSGFLRSEL AIKTWIQLAK EAGCAQLFNC PVTAIRHDDD 
GVTIETADGE YQAKKAIVCA GTWVKDLLPE LPVQPVRKVF AWYQADGRYS VKNKFPAFTG 
ELPNGDQYYG FPAENDALKI GKHNGGQVIH SADERVPFAE VASDGSEAFP FLRNVLPGIG 
CCLYGAACTY DNSPDEDFII DTLPGHDNTL LITGLSGHGF KFASVLGEIA ADFAQDKKSD 
FDLTPFRLSR FQ