Gene EcDH1_0719 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_0719
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	758304
End bp	759527
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	56%
IMG OID
Product	protein of unknown function DUF224 cysteine-rich region domain protein
Protein accession	ACX38403
Protein GI	260447981
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAACCC AATTAACTGA AGAGATGCGG CAGAACGCGC GCGCGCTGGA AGCCGACAGC 
ATCCTGCGCG CCTGTGTTCA CTGCGGATTT TGTACCGCAA CCTGCCCAAC CTATCAGCTT 
CTGGGCGATG AACTGGACGG GCCGCGCGGG CGCATCTATC TGATTAAACA GGTGCTGGAA 
GGCAACGAAG TCACGCTTAA AACACAGGAG CATCTCGATC GCTGCCTCAC TTGCCGTAAT 
TGTGAAACCA CCTGTCCTTC TGGTGTGCGC TATCACAATT TGCTGGATAT CGGGCGTGAT 
ATTGTCGAGC AGAAAGTGAA ACGCCCACTG CCGGAGCGAA TACTGCGCGA AGGATTGCGC 
CAGGTAGTGC CGCGTCCGGC GGTCTTCCGT GCGCTGACGC AGGTAGGGCT GGTGCTGCGA 
CCGTTTTTAC CGGAACAGGT CAGAGCAAAA CTGCCTGCTG AAACGGTGAA AGCTAAACCG 
CGTCCGCCGC TGCGCCATAA GCGTCGGGTT TTAATGTTGG AAGGCTGCGC CCAGCCTACG 
CTTTCGCCCA ACACCAACGC GGCAACTGCG CGAGTGCTGG ATCGTCTGGG GATCAGCGTC 
ATGCCAGCTA ACGAAGCAGG CTGTTGTGGC GCGGTGGACT ATCATCTTAA TGCGCAGGAG 
AAAGGGCTGG CACGGGCGCG CAATAATATT GATGCCTGGT GGCCCGCGAT TGAAGCAGGT 
GCCGAGGCAA TTTTGCAAAC CGCCAGCGGC TGCGGCGCGT TTGTCAAAGA GTATGGGCAG 
ATGCTGAAAA ACGATGCGTT ATATGCCGAT AAAGCACGTC AGGTCAGTGA ACTGGCGGTC 
GATTTAGTCG AACTTCTGCG CGAGGAACCG CTGGAAAAAC TGGCAATTCG CGGCGATAAA 
AAGCTGGCCT TCCACTGTCC GTGTACCCTA CAACATGCGC AAAAGCTGAA CGGCGAAGTG 
GAAAAAGTGT TGCTTCGTCT TGGATTTACC TTAACGGACG TTCCCGACAG CCATCTGTGC 
TGCGGTTCAG CGGGAACATA TGCGTTAACG CATCCCGATC TGGCACGCCA GCTGCGGGAT 
AACAAAATGA ATGCGCTGGA AAGCGGCAAA CCGGAAATGA TCGTCACCGC CAACATTGGT 
TGCCAGACGC ATCTGGCGAG CGCCGGTCGT ACCTCTGTGC GTCACTGGAT TGAAATTGTA 
GAACAAGCCC TTGAAAAGGA ATAA

Protein sequence

MQTQLTEEMR QNARALEADS ILRACVHCGF CTATCPTYQL LGDELDGPRG RIYLIKQVLE 
GNEVTLKTQE HLDRCLTCRN CETTCPSGVR YHNLLDIGRD IVEQKVKRPL PERILREGLR 
QVVPRPAVFR ALTQVGLVLR PFLPEQVRAK LPAETVKAKP RPPLRHKRRV LMLEGCAQPT 
LSPNTNAATA RVLDRLGISV MPANEAGCCG AVDYHLNAQE KGLARARNNI DAWWPAIEAG 
AEAILQTASG CGAFVKEYGQ MLKNDALYAD KARQVSELAV DLVELLREEP LEKLAIRGDK 
KLAFHCPCTL QHAQKLNGEV EKVLLRLGFT LTDVPDSHLC CGSAGTYALT HPDLARQLRD 
NKMNALESGK PEMIVTANIG CQTHLASAGR TSVRHWIEIV EQALEKE