Gene EcDH1_1021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1021
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	1089747
End bp	1091027
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	59%
IMG OID
Product	4-aminobutyrate aminotransferase
Protein accession	ACX38702
Protein GI	260448280
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAGCA ATAAAGAGTT AATGCAGCGC CGCAGTCAGG CGATTCCCCG TGGCGTTGGG 
CAAATTCACC CGATTTTCGC TGACCGCGCG GAAAACTGCC GGGTGTGGGA CGTTGAAGGC 
CGTGAGTATC TTGATTTCGC GGGCGGGATT GCGGTGCTCA ATACCGGGCA CCTGCATCCG 
AAGGTGGTGG CCGCGGTGGA AGCGCAGTTG AAAAAACTGT CGCACACCTG CTTCCAGGTG 
CTGGCTTACG AGCCGTATCT GGAGCTGTGC GAGATTATGA ATCAGAAGGT GCCGGGCGAT 
TTCGCCAAGA AAACGCTGCT GGTTACGACC GGTTCCGAAG CGGTGGAAAA CGCGGTAAAA 
ATCGCCCGCG CCGCCACCAA ACGTAGCGGC ACCATCGCTT TTAGCGGCGC GTATCACGGG 
CGCACGCATT ACACGCTGGC GCTGACCGGC AAGGTGAATC CGTACTCTGC GGGCATGGGG 
CTGATGCCGG GTCATGTTTA TCGCGCGCTT TATCCTTGCC CGCTGCACGG CATAAGCGAG 
GATGACGCTA TCGCCAGCAT CCACCGGATC TTCAAAAATG ATGCCGCGCC GGAAGATATC 
GCCGCCATCG TGATTGAGCC GGTTCAGGGC GAAGGCGGTT TCTACGCCTC GTCGCCAGCC 
TTTATGCAGC GTTTACGCGC TCTGTGTGAC GAGCACGGGA TCATGCTGAT TGCCGATGAA 
GTGCAGAGCG GCGCGGGGCG TACCGGCACG CTGTTTGCGA TGGAGCAGAT GGGCGTTGCG 
CCGGATCTTA CCACCTTTGC GAAATCGATC GCGGGCGGCT TCCCGCTGGC GGGCGTCACC 
GGGCGCGCGG AAGTAATGGA TGCCGTCGCT CCAGGCGGTC TGGGCGGCAC CTATGCGGGT 
AACCCGATTG CCTGCGTGGC TGCGCTGGAA GTGTTGAAGG TGTTTGAGCA GGAAAATCTG 
CTGCAAAAAG CCAACGATCT GGGGCAGAAG TTGAAAGACG GATTGCTGGC GATAGCCGAA 
AAACACCCGG AGATCGGCGA CGTACGCGGG CTGGGGGCGA TGATCGCCAT TGAGCTGTTT 
GAAGACGGCG ATCACAACAA GCCGGACGCC AAACTCACCG CCGAGATCGT GGCTCGCGCC 
CGCGATAAAG GCCTGATTCT TCTCTCCTGC GGCCCGTATT ACAACGTGCT GCGCATCCTT 
GTACCGCTCA CCATTGAAGA CGCTCAGATC CGTCAGGGTC TGGAGATCAT CAGCCAGTGT 
TTTGATGAGG CGAAGCAGTA G

Protein sequence

MNSNKELMQR RSQAIPRGVG QIHPIFADRA ENCRVWDVEG REYLDFAGGI AVLNTGHLHP 
KVVAAVEAQL KKLSHTCFQV LAYEPYLELC EIMNQKVPGD FAKKTLLVTT GSEAVENAVK 
IARAATKRSG TIAFSGAYHG RTHYTLALTG KVNPYSAGMG LMPGHVYRAL YPCPLHGISE 
DDAIASIHRI FKNDAAPEDI AAIVIEPVQG EGGFYASSPA FMQRLRALCD EHGIMLIADE 
VQSGAGRTGT LFAMEQMGVA PDLTTFAKSI AGGFPLAGVT GRAEVMDAVA PGGLGGTYAG 
NPIACVAALE VLKVFEQENL LQKANDLGQK LKDGLLAIAE KHPEIGDVRG LGAMIAIELF 
EDGDHNKPDA KLTAEIVARA RDKGLILLSC GPYYNVLRIL VPLTIEDAQI RQGLEIISQC 
FDEAKQ