Gene EcDH1_3448 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3448
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	3696495
End bp	3697775
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	56%
IMG OID
Product	glutamate-1-semialdehyde-2,1-aminomutase
Protein accession	ACX41063
Protein GI	260450641
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAGT CTGAAAATCT TTACAGCGCA GCGCGCGAGC TGATCCCTGG CGGTGTGAAC 
TCCCCTGTTC GCGCCTTTAC TGGCGTGGGC GGCACTCCAC TGTTTATCGA AAAAGCGGAC 
GGCGCTTATC TGTACGATGT TGATGGCAAA GCCTATATCG ATTATGTCGG TTCCTGGGGG 
CCGATGGTGC TGGGCCATAA CCATCCGGCA ATCCGCAATG CCGTGATTGA AGCCGCCGAG 
CGTGGTTTAA GCTTTGGTGC ACCAACCGAA ATGGAAGTGA AAATGGCGCA ACTGGTGACC 
GAACTGGTCC CGACCATGGA TATGGTGCGC ATGGTGAACT CCGGCACTGA AGCGACCATG 
AGCGCCATCC GCCTGGCCCG TGGTTTTACC GGTCGCGACA AAATTATTAA ATTTGAAGGG 
TGTTACCATG GTCACGCTGA CTGCCTGCTG GTGAAAGCCG GTTCTGGCGC ACTCACGTTA 
GGCCAGCCAA ACTCGCCGGG CGTTCCGGCA GATTTCGCCA AATATACCTT AACCTGTACT 
TATAATGATC TGGCTTCTGT ACGCGCCGCA TTTGAGCAAT ACCCGCAAGA GATTGCCTGT 
ATTATCGTCG AGCCGGTGGC AGGCAATATG AACTGTGTTC CGCCGCTGCC AGAGTTCCTG 
CCAGGTCTGC GCGCGCTGTG CGACGAATTT GGCGCGTTGC TGATCATCGA TGAAGTGATG 
ACCGGTTTCC GCGTAGCGCT AGCTGGCGCA CAGGATTATT ACGGCGTAGT GCCAGATTTA 
ACCTGCCTCG GCAAAATCAT CGGCGGTGGA ATGCCGGTAG GCGCATTCGG TGGTCGTCGT 
GATGTAATGG ATGCGCTGGC CCCGACGGGT CCGGTCTATC AGGCGGGTAC GCTTTCCGGT 
AACCCGATTG CGATGGCAGC GGGTTTCGCC TGTCTGAATG AAGTCGCGCA GCCGGGCGTT 
CACGAAACGC TGGATGAGCT GACAACACGT CTGGCAGAAG GTCTGCTGGA AGCGGCAGAA 
GAAGCCGGAA TTCCGCTGGT CGTTAACCAC GTTGGCGGCA TGTTCGGTAT TTTCTTTACC 
GACGCCGAGT CCGTGACGTG CTATCAGGAT GTGATGGCCT GTGACGTGGA ACGCTTTAAG 
CGTTTCTTCC ATATGATGCT GGACGAAGGT GTTTACCTGG CACCGTCAGC GTTTGAAGCG 
GGCTTTATGT CCGTGGCGCA CAGCATGGAA GATATCAATA ACACCATCGA TGCTGCACGT 
CGGGTGTTTG CGAAGTTGTG A

Protein sequence

MSKSENLYSA ARELIPGGVN SPVRAFTGVG GTPLFIEKAD GAYLYDVDGK AYIDYVGSWG 
PMVLGHNHPA IRNAVIEAAE RGLSFGAPTE MEVKMAQLVT ELVPTMDMVR MVNSGTEATM 
SAIRLARGFT GRDKIIKFEG CYHGHADCLL VKAGSGALTL GQPNSPGVPA DFAKYTLTCT 
YNDLASVRAA FEQYPQEIAC IIVEPVAGNM NCVPPLPEFL PGLRALCDEF GALLIIDEVM 
TGFRVALAGA QDYYGVVPDL TCLGKIIGGG MPVGAFGGRR DVMDALAPTG PVYQAGTLSG 
NPIAMAAGFA CLNEVAQPGV HETLDELTTR LAEGLLEAAE EAGIPLVVNH VGGMFGIFFT 
DAESVTCYQD VMACDVERFK RFFHMMLDEG VYLAPSAFEA GFMSVAHSME DINNTIDAAR 
RVFAKL