Gene EcDH1_1537 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1537
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	1667756
End bp	1668892
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	54%
IMG OID
Product	VWA containing CoxE family protein
Protein accession	ACX39206
Protein GI	260448784
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGAAC TGAACGATCT TCTGACCACC CGTGAGCTAC AACGCTGGCG ATTAATTCTT 
GGCGAAGCGG CAGAAACGAC GCTTTGTGGG CTGGATGACA ACGCCCGGCA GATAGACCAC 
GCGCTGGAGT GGCTGTATGG GCGCGATCCT GAACGGCTCC AGCGTGGTGA ACGTTCCGGT 
GGATTAGGTG GCTCAAATCT CACCACCCCT GAGTGGATCA ACAGTATTCA CACGCTGTTT 
CCGCAGCAGG TGATTGAGCG GCTGGAAAGC GATGCCGTGC TGCGCTACGG CATTGAAGAT 
GTGGTGACGA ATCTCGACGT GCTGGAACGT ATGCAGCCTT CTGAAAGCCT GCTACGCGCT 
GTTTTGCACA CCAAACATCT GATGAACCCC GAAGTACTGG CTGCCGCCCG CCGGATAGTG 
TGCCAGGTTG TTGAAGAAAT TATGGCTCGA CTGGCAAAGG AAGTTCGTCA GGCTTTTTCT 
GGTGTCCGCG ATCGCCGTCG CCGTTCATTT ATTCCACTGG CGCGAAACTT TGATTTCAAA 
AGTACTCTGC GCGCCAACCT GCAACACTGG CACCCGCAAC ACGGCAAGTT GTATATCGAA 
TCCCCCCGCT TTAACAGCCG CATTAAACGC CAAAGCGAAC AATGGCAACT GGTCTTACTG 
GTTGATCAAA GCGGATCGAT GGTCGATTCG GTGATCCACT CTGCGGTGAT GGCGGCCTGT 
TTGTGGCAGT TACCCGGCAT TCGTACCCAT CTGGTGGCGT TTGACACAAG CGTCGTTGAT 
CTCACGGCAG ACGTTGCCGA TCCGGTAGAG TTATTAATGA AAGTACAGTT GGGCGGCGGG 
ACCAATATCG CCAGTGCCGT GGAGTATGGT CGGCAACTTA TTGAACAACC AGCGAAAAGC 
GTCATTATCC TCGTGAGCGA TTTTTACGAA GGGGGTTCAT CATCATTACT GACGCATCAG 
GTGAAAAAGT GTGTCCAGAG CGGCATCAAA GTGCTGGGAC TGGCAGCGCT CGATAGCACC 
GCAACACCTT GCTATGACCG CGATACGGCC CAGGCGCTGG TTAATGTCGG CGCACAAATA 
GCCGCCATGA CGCCGGGCGA GCTGGCATCA TGGCTTGCGG AGAATCTTCA GTCATGA

Protein sequence

MSELNDLLTT RELQRWRLIL GEAAETTLCG LDDNARQIDH ALEWLYGRDP ERLQRGERSG 
GLGGSNLTTP EWINSIHTLF PQQVIERLES DAVLRYGIED VVTNLDVLER MQPSESLLRA 
VLHTKHLMNP EVLAAARRIV CQVVEEIMAR LAKEVRQAFS GVRDRRRRSF IPLARNFDFK 
STLRANLQHW HPQHGKLYIE SPRFNSRIKR QSEQWQLVLL VDQSGSMVDS VIHSAVMAAC 
LWQLPGIRTH LVAFDTSVVD LTADVADPVE LLMKVQLGGG TNIASAVEYG RQLIEQPAKS 
VIILVSDFYE GGSSSLLTHQ VKKCVQSGIK VLGLAALDST ATPCYDRDTA QALVNVGAQI 
AAMTPGELAS WLAENLQS