Gene EcDH1_2516 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_2516
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	2687753
End bp	2689123
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	52%
IMG OID
Product	adenylosuccinate lyase
Protein accession	ACX40152
Protein GI	260449730
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.00611502
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATTAT CCTCACTGAC CGCCGTTTCC CCTGTCGATG GACGCTACGG CGATAAAGTC 
AGCGCGCTGC GCGGGATTTT CAGCGAATAT GGTTTGCTGA AATTCCGTGT ACAAGTTGAA 
GTACGTTGGC TGCAAAAACT GGCCGCGCAC GCAGCGATCA AGGAAGTTCC TGCTTTTGCT 
GCCGACGCAA TCGGTTACCT TGATGCAATC GTCGCCAGTT TCAGCGAAGA AGATGCGGCG 
CGCATCAAAA CTATCGAGCG TACCACTAAC CACGACGTTA AAGCGGTTGA GTATTTCCTG 
AAAGAAAAAG TGGCGGAGAT CCCGGAACTG CACGCGGTTT CTAAATTCAT CCACTTTGCC 
TGTACTTCGG AAGATATCAA TAACCTCTCC CACGCATTAA TGCTGAAAAC CGCGCGTGAT 
GAAGTGATCC TGCCATACTG GCGTCAACTG ATTGATGGCA TTAAAGATCT CGCCGTTCAG 
TATCGCGATA TCCCGCTGCT GTCTCGTACC CACGGTCAGC CAGCCACGCC GTCAACCATC 
GGTAAAGAGA TGGCAAACGT CGCCTACCGT ATGGAGCGCC AGTACCGCCA GCTTAACCAG 
GTGGAGATCC TCGGCAAAAT CAACGGCGCG GTCGGTAACT ATAACGCCCA CATCGCCGCT 
TACCCGGAAG TTGACTGGCA TCAGTTCAGC GAAGAGTTCG TCACCTCGCT GGGTATTCAG 
TGGAACCCGT ACACCACCCA GATCGAACCG CACGACTACA TTGCCGAACT GTTTGATTGC 
GTTGCGCGCT TCAACACTAT TCTGATCGAC TTTGACCGTG ACGTCTGGGG TTATATCGCC 
CTTAACCACT TCAAACAGAA AACCATTGCT GGTGAGATTG GTTCTTCCAC CATGCCGCAT 
AAAGTTAACC CGATCGACTT CGAAAACTCC GAAGGGAATC TGGGCCTTTC CAACGCGGTA 
TTGCAGCATC TGGCAAGCAA ACTGCCGGTT TCCCGCTGGC AGCGTGACCT GACCGACTCT 
ACCGTGCTGC GTAACCTCGG CGTGGGTATC GGTTATGCCT TGATTGCATA TCAATCCACC 
CTGAAAGGCG TGAGCAAACT GGAAGTGAAC CGTGACCATC TGCTGGATGA ACTGGATCAC 
AACTGGGAAG TGCTGGCTGA ACCAATCCAG ACAGTTATGC GTCGCTATGG CATCGAAAAA 
CCGTACGAGA AGCTGAAAGA GCTGACTCGC GGTAAGCGCG TTGACGCCGA AGGCATGAAG 
CAGTTTATCG ATGGTCTGGC GTTGCCAGAA GAAGAGAAAG CCCGCCTGAA AGCGATGACG 
CCGGCTAACT ATATTGGTCG AGCTATCACG ATGGTTGATG AGCTGAAATA A

Protein sequence

MELSSLTAVS PVDGRYGDKV SALRGIFSEY GLLKFRVQVE VRWLQKLAAH AAIKEVPAFA 
ADAIGYLDAI VASFSEEDAA RIKTIERTTN HDVKAVEYFL KEKVAEIPEL HAVSKFIHFA 
CTSEDINNLS HALMLKTARD EVILPYWRQL IDGIKDLAVQ YRDIPLLSRT HGQPATPSTI 
GKEMANVAYR MERQYRQLNQ VEILGKINGA VGNYNAHIAA YPEVDWHQFS EEFVTSLGIQ 
WNPYTTQIEP HDYIAELFDC VARFNTILID FDRDVWGYIA LNHFKQKTIA GEIGSSTMPH 
KVNPIDFENS EGNLGLSNAV LQHLASKLPV SRWQRDLTDS TVLRNLGVGI GYALIAYQST 
LKGVSKLEVN RDHLLDELDH NWEVLAEPIQ TVMRRYGIEK PYEKLKELTR GKRVDAEGMK 
QFIDGLALPE EEKARLKAMT PANYIGRAIT MVDELK