Gene EcDH1_2020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_2020
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	2176349
End bp	2177521
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	51%
IMG OID
Product	aminotransferase class I and II
Protein accession	ACX39677
Protein GI	260449255
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.07254
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCGATT TTTCAAAGGT CGTGGATCGT CATGGCACAT GGTGTACACA GTGGGATTAT 
GTCGCTGACC GTTTCGGCAC TGCTGACCTG TTACCGTTCA CGATTTCAGA CATGGATTTT 
GCCACTGCCC CCTGCATTAT CGAGGCGCTG AATCAGCGCC TGATGCACGG CGTATTTGGC 
TACAGCCGCT GGAAAAACGA TGAGTTTCTC GCGGCTATTG CCCACTGGTT TTCCACCCAG 
CATTACACCG CCATCGATTC TCAGACGGTG GTGTATGGCC CTTCTGTCAT CTATATGGTT 
TCAGAACTGA TTCGTCAGTG GTCTGAAACA GGTGAAGGCG TGGTGATCCA CACACCCGCC 
TATGACGCAT TTTACAAGGC CATTGAAGGT AACCAGCGCA CAGTAATGCC CGTTGCTTTA 
GAGAAGCAGG CTGATGGTTG GTTTTGCGAT ATGGGCAAGT TGGAAGCCGT GTTGGCGAAA 
CCAGAATGTA AAATTATGCT CCTGTGTAGC CCACAGAATC CTACCGGGAA AGTGTGGACG 
TGCGATGAGC TGGAGATCAT GGCTGACCTG TGCGAGCGTC ATGGTGTGCG GGTTATTTCC 
GATGAAATCC ATATGGATAT GGTTTGGGGC GAGCAGCCGC ATATTCCCTG GAGTAATGTG 
GCTCGCGGAG ACTGGGCGTT GCTAACGTCG GGCTCGAAAA GTTTCAATAT TCCCGCCCTG 
ACCGGTGCTT ACGGGATTAT AGAAAATAGC AGTAGCCGCG ATGCCTATTT ATCGGCACTG 
AAAGGCCGTG ATGGGCTTTC TTCCCCTTCG GTACTGGCGT TAACTGCCCA TATCGCCGCC 
TATCAGCAAG GCGCGCCGTG GCTGGATGCC TTACGCATCT ATCTGAAAGA TAACCTGACG 
TATATCGCAG ATAAAATGAA CGCCGCGTTT CCTGAACTCA ACTGGCAGAT CCCACAATCC 
ACTTATCTGG CATGGCTTGA TTTACGTCCG TTGAATATTG ACGACAACGC GTTGCAAAAA 
GCACTTATCG AACAAGAAAA AGTCGCGATC ATGCCGGGGT ATACCTACGG TGAAGAAGGT 
CGTGGTTTTG TCCGTCTCAA TGCCGGCTGC CCACGTTCGA AACTGGAAAA AGGTGTGGCT 
GGATTAATTA ACGCCATCCG CGCTGTTCGT TAA

Protein sequence

MFDFSKVVDR HGTWCTQWDY VADRFGTADL LPFTISDMDF ATAPCIIEAL NQRLMHGVFG 
YSRWKNDEFL AAIAHWFSTQ HYTAIDSQTV VYGPSVIYMV SELIRQWSET GEGVVIHTPA 
YDAFYKAIEG NQRTVMPVAL EKQADGWFCD MGKLEAVLAK PECKIMLLCS PQNPTGKVWT 
CDELEIMADL CERHGVRVIS DEIHMDMVWG EQPHIPWSNV ARGDWALLTS GSKSFNIPAL 
TGAYGIIENS SSRDAYLSAL KGRDGLSSPS VLALTAHIAA YQQGAPWLDA LRIYLKDNLT 
YIADKMNAAF PELNWQIPQS TYLAWLDLRP LNIDDNALQK ALIEQEKVAI MPGYTYGEEG 
RGFVRLNAGC PRSKLEKGVA GLINAIRAVR