Gene EcDH1_1593 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1593
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	1736444
End bp	1738297
Gene Length	1854 bp
Protein Length	617 aa
Translation table	11
GC content	53%
IMG OID
Product	AsmA family protein
Protein accession	ACX39258
Protein GI	260448836
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.00514431
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGACGAT TTCTGACGAC GCTGATGATA CTCCTGGTCG TGCTGGTGGC CGGGTTATCT 
GCGTTAGTGT TGCTGGTGAA TCCGAATGAT TTCCGCGACT ATATGGTCAA GCAAGTTGCT 
GCACGTAGCG GTTATCAATT GCAGCTCGAC GGGCCACTGC GTTGGCACGT CTGGCCGCAG 
CTTAGTATCC TCTCCGGGCG AATGTCTCTC ACCGCCCAGG GCGCAAGCCA GCCACTGGTT 
CGCGCCGACA ACATGCGTCT GGACGTGGCG CTTTTACCAC TACTGAGTCA TCAACTGAGC 
GTTAAGCAGG TGATGCTAAA AGGGGCAGTG ATCCAACTGA CGCCGCAGAC GGAAGCGGTG 
CGCAGTGAAG ACGCTCCGGT TGCACCGCGC GACAATACCT TGCCGGATCT GTCAGACGAT 
CGCGGATGGT CGTTTGATAT ATCCAGTCTT AAGGTGGCGG ACAGCGTGCT GGTGTTCCAG 
CATGAAGATG ACGAGCAGGT GACAATCCGC AATATTCGCC TGCAAATGGA ACAAGATCCC 
CAACATCGTG GTTCATTTGA GTTCTCCGGG CGGGTTAATC GCGATCAGCG CGATCTCACG 
ATATCCCTTA ACGGTACGGT AGATGCTTCT GATTATCCGC ATGATTTAAC GGCGGCTATT 
GAACAAATTA ACTGGCAGTT GCAGGGTGCC GATTTACCAA AACAAGGTAT TCAGGGGCAG 
GGGAGTTTCC AGGCCCAGTG GCAGGAGTCA CATAAACGCC TTTCATTTAA CCAAATTAGT 
TTGACCGCCA ATGATAGTAC GCTAAGCGGG CAAGCACAGG TTACGCTGAC AGAGAAACCG 
GAATGGCAGC TGAGGCTGCA ATTCCCGCAA CTGAATCTTG ACAACCTCAT CCCGCTTAAT 
GAAACCGCGA ATGGTGAAAA CGGTGCCGCG CAGCAGGGGC AGAGCCAATC AACGTTGCCG 
CGCCCGGTCA TTTCTTCGCG TATTGATGAA CCGGCCTATC AGGGACTGCA AGGCTTTACG 
GCTGATATTT TGTTGCAGGC CAGTAACGTG CGCTGGCGCG GAATGAATTT TACAGATGTT 
GCCACGCAAA TGACCAACAA GTCGGGTTTG CTGGAAATTA CTCAACTGCA GGGCAAACTT 
AACGGTGGAC AGGTTTCACT GCCGGGCACG CTGGACGCGA CATCAATAAA TCCGCGGATA 
AACTTCCAGC CACGGCTGGA AAACGTTGAG ATTGGTACCA TTCTGAAGGC GTTTAACTAT 
CCGATTTCGT TGACCGGAAA AATGTCACTG GCTGGTGATT TCTCCGGTGC TGACATAGAT 
GCCGACGCAT TCCGCCACAA CTGGCAAGGA CAGGCACATG TCGAAATGAC CGACACGCGC 
ATGGAAGGGA TGAACTTCCA GCAGATGATT CAGCAAGCGG TAGAGCGTAA TGGCGGTGAT 
GTGAAGGCCG CTGAAAACTT TGATAACGTG ACGCGGCTTG ACCGCTTTAC CACCGATTTG 
ACGTTGAAGG ATGGCGTCGT GACGTTAAAC GACATGCAAG GTCAATCGCC TGTGCTGGCG 
CTGACAGGGG AAGGCATGTT GAATCTGGCA GATCAAACCT GCGACACCCA GTTTGATATT 
CGGGTCGTGG GTGGCTGGAA CGGGGAAAGC AAACTGATTG ATTTCCTGAA AGAAACGCCA 
GTACCGCTGC GGGTTTATGG CAACTGGCAG CAACTCAATT ACAGCCTGCA AGTGGATCAG 
TTACTGCGCA AACATCTACA GGACGAAGCG AAACGTCGCC TGAATGACTG GGCCGAGCGG 
AATAAAGATT CCCGTAATGG CAAAGATGTG AAGAAGTTGC TGGAGAAGAT GTAG

Protein sequence

MRRFLTTLMI LLVVLVAGLS ALVLLVNPND FRDYMVKQVA ARSGYQLQLD GPLRWHVWPQ 
LSILSGRMSL TAQGASQPLV RADNMRLDVA LLPLLSHQLS VKQVMLKGAV IQLTPQTEAV 
RSEDAPVAPR DNTLPDLSDD RGWSFDISSL KVADSVLVFQ HEDDEQVTIR NIRLQMEQDP 
QHRGSFEFSG RVNRDQRDLT ISLNGTVDAS DYPHDLTAAI EQINWQLQGA DLPKQGIQGQ 
GSFQAQWQES HKRLSFNQIS LTANDSTLSG QAQVTLTEKP EWQLRLQFPQ LNLDNLIPLN 
ETANGENGAA QQGQSQSTLP RPVISSRIDE PAYQGLQGFT ADILLQASNV RWRGMNFTDV 
ATQMTNKSGL LEITQLQGKL NGGQVSLPGT LDATSINPRI NFQPRLENVE IGTILKAFNY 
PISLTGKMSL AGDFSGADID ADAFRHNWQG QAHVEMTDTR MEGMNFQQMI QQAVERNGGD 
VKAAENFDNV TRLDRFTTDL TLKDGVVTLN DMQGQSPVLA LTGEGMLNLA DQTCDTQFDI 
RVVGGWNGES KLIDFLKETP VPLRVYGNWQ QLNYSLQVDQ LLRKHLQDEA KRRLNDWAER 
NKDSRNGKDV KKLLEKM