Gene EcDH1_3983 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3983
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	4297391
End bp	4298992
Gene Length	1602 bp
Protein Length	533 aa
Translation table	11
GC content	52%
IMG OID
Product	malate synthase A
Protein accession	ACX41583
Protein GI	260451161
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	51
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGAAC AGGCAACAAC AACCGATGAA CTGGCTTTCA CAAGGCCGTA TGGCGAGCAG 
GAGAAGCAAA TTCTTACTGC CGAAGCGGTA GAATTTCTGA CTGAGCTGGT GACGCATTTT 
ACGCCACAAC GCAATAAACT TCTGGCAGCG CGCATTCAGC AGCAGCAAGA TATTGATAAC 
GGAACGTTGC CTGATTTTAT TTCGGAAACA GCTTCCATTC GCGATGCTGA TTGGAAAATT 
CGCGGGATTC CTGCGGACTT AGAAGACCGC CGCGTAGAGA TAACTGGCCC GGTAGAGCGC 
AAGATGGTGA TCAACGCGCT CAACGCCAAT GTGAAAGTCT TTATGGCCGA TTTCGAAGAT 
TCACTGGCAC CAGACTGGAA CAAAGTGATC GACGGGCAAA TTAACCTGCG TGATGCGGTT 
AACGGCACCA TCAGTTACAC CAATGAAGCA GGCAAAATTT ACCAGCTCAA GCCCAATCCA 
GCGGTTTTGA TTTGTCGGGT ACGCGGTCTG CACTTGCCGG AAAAACATGT CACCTGGCGT 
GGTGAGGCAA TCCCCGGCAG CCTGTTTGAT TTTGCGCTCT ATTTCTTCCA CAACTATCAG 
GCACTGTTGG CAAAGGGCAG TGGTCCCTAT TTCTATCTGC CGAAAACCCA GTCCTGGCAG 
GAAGCGGCCT GGTGGAGCGA AGTCTTCAGC TATGCAGAAG ATCGCTTTAA TCTGCCGCGC 
GGCACCATCA AGGCGACGTT GCTGATTGAA ACGCTGCCCG CCGTGTTCCA GATGGATGAA 
ATCCTTCACG CGCTGCGTGA CCATATTGTT GGTCTGAACT GCGGTCGTTG GGATTACATC 
TTCAGCTATA TCAAAACGTT GAAAAACTAT CCCGATCGCG TCCTGCCAGA CAGACAGGCA 
GTGACGATGG ATAAACCATT CCTGAATGCT TACTCACGCC TGTTGATTAA AACCTGCCAT 
AAACGCGGTG CTTTTGCGAT GGGCGGCATG GCGGCGTTTA TTCCGAGCAA AGATGAAGAG 
CACAATAACC AGGTGCTCAA CAAAGTAAAA GCGGATAAAT CGCTGGAAGC CAATAACGGT 
CACGATGGCA CATGGATCGC TCACCCAGGC CTTGCGGACA CGGCAATGGC GGTATTCAAC 
GACATTCTCG GCTCCCGTAA AAATCAGCTT GAAGTGATGC GCGAACAAGA CGCGCCGATT 
ACTGCCGATC AGCTGCTGGC ACCTTGTGAT GGTGAACGCA CCGAAGAAGG TATGCGCGCC 
AACATTCGCG TGGCTGTGCA GTACATCGAA GCGTGGATCT CTGGCAACGG CTGTGTGCCG 
ATTTATGGCC TGATGGAAGA TGCGGCGACG GCTGAAATTT CCCGTACCTC GATCTGGCAG 
TGGATCCATC ATCAAAAAAC GTTGAGCAAT GGCAAACCGG TGACCAAAGC CTTGTTCCGC 
CAGATGCTGG GCGAAGAGAT GAAAGTCATT GCCAGCGAAC TGGGCGAAGA ACGTTTCTCC 
CAGGGGCGTT TTGACGATGC CGCACGCTTG ATGGAACAGA TCACCACTTC CGATGAGTTA 
ATTGATTTCC TGACCCTGCC AGGCTACCGC CTGTTAGCGT AA

Protein sequence

MTEQATTTDE LAFTRPYGEQ EKQILTAEAV EFLTELVTHF TPQRNKLLAA RIQQQQDIDN 
GTLPDFISET ASIRDADWKI RGIPADLEDR RVEITGPVER KMVINALNAN VKVFMADFED 
SLAPDWNKVI DGQINLRDAV NGTISYTNEA GKIYQLKPNP AVLICRVRGL HLPEKHVTWR 
GEAIPGSLFD FALYFFHNYQ ALLAKGSGPY FYLPKTQSWQ EAAWWSEVFS YAEDRFNLPR 
GTIKATLLIE TLPAVFQMDE ILHALRDHIV GLNCGRWDYI FSYIKTLKNY PDRVLPDRQA 
VTMDKPFLNA YSRLLIKTCH KRGAFAMGGM AAFIPSKDEE HNNQVLNKVK ADKSLEANNG 
HDGTWIAHPG LADTAMAVFN DILGSRKNQL EVMREQDAPI TADQLLAPCD GERTEEGMRA 
NIRVAVQYIE AWISGNGCVP IYGLMEDAAT AEISRTSIWQ WIHHQKTLSN GKPVTKALFR 
QMLGEEMKVI ASELGEERFS QGRFDDAARL MEQITTSDEL IDFLTLPGYR LLA