Gene ECH74115_0331 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0331
Symbol
ID	6966845
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	337219
End bp	338175
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	61%
IMG OID	643384392
Product	FAD binding domain in molybdopterin dehydrogenase
Protein accession	YP_002268907
Protein GI	209398590
COG category	[C] Energy production and conversion
COG ID	[COG1319] Aerobic-type carbon monoxide dehydrogenase, middle subunit CoxM/CutM homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGCGT TTACCTATGA ACGAGTGAAC ACCCCCGCCG AGGCGGCACT TAGCGCTCAG 
CGCGTACCCG GCGCAAAATT TATCGCGGGC GGGACCAATC TGCTGGACCT GATGAAGCTG 
GAAATTGAAA CGCCCACCCA CCTTATCGAT GTGAACGGGC TCGGGCTCGA TAAGATCGAA 
GTGACCGACG CGGGTGGGCT GCGCATCGGC GCACTGGTAC GGAACACCGA CCTGGTGGCT 
CACGAGCGCG TGCGTCGTGA TTACGCGGTA CTCTCCCGCG CCCTGCTCGC TGGCGCGTCT 
GGTCAGTTAC GCAATCAGGC AACCACAGCA GGTAATCTGC TCCAGCGCAC GCGCTGCCCC 
TATTTTTACG ACACCAATCA GCCCTGCAAT AAGCGCCTGC CCGGGAGCGG CTGCGCGGCG 
CTTGAAGGCT TTAGCCGTCA GCACGCGGTG GTAGGCGTAA GCGAAGCCTG CATTGCCACC 
CATCCGAGCG ATATGGCGGT CGCAATGCGG TTGCTGGATG CGGTGGTGGA AACCATCACG 
CCGGAGGGAA AGACTCGCAG TATCACACTG GCTGATTTTT ATCACCCACC GGGGAAAACG 
CCGCACATTG AAACCGCCCT GCTTCCCGGT GAGCTTATCG TTGCGGTGAC GTTACCTCCG 
CCGCTCGGCG GAAAACATAT CTACCGTAAG GTGCGCGATC GCGCCTCCTA CGCCTTTGCC 
CTGGTATCGG TCGCGGCGAT TATTCAGCCT GACGGCAGCG GGCGCGTCGC GCTGGGCGGA 
GTAGCACATA AGCCCTGGCG CATTGAGGCT GCGGATGCTC AGCTATCCCA GGGGGCGCAG 
GCCGTATATG ACGCGCTGTT CGCCAGCGCC CATCCCACCG CTGAAAACAC CTTTAAACTC 
CTGTTGGCGA AGCGAACGCT TGCCTCCGTA CTGGCTGAAG CGAGGGCACA AGCATGA

Protein sequence

MKAFTYERVN TPAEAALSAQ RVPGAKFIAG GTNLLDLMKL EIETPTHLID VNGLGLDKIE 
VTDAGGLRIG ALVRNTDLVA HERVRRDYAV LSRALLAGAS GQLRNQATTA GNLLQRTRCP 
YFYDTNQPCN KRLPGSGCAA LEGFSRQHAV VGVSEACIAT HPSDMAVAMR LLDAVVETIT 
PEGKTRSITL ADFYHPPGKT PHIETALLPG ELIVAVTLPP PLGGKHIYRK VRDRASYAFA 
LVSVAAIIQP DGSGRVALGG VAHKPWRIEA ADAQLSQGAQ AVYDALFASA HPTAENTFKL 
LLAKRTLASV LAEARAQA