Gene EcHS_A3633 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3633
Symbol	asd
ID	5594793
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3620812
End bp	3621915
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	54%
IMG OID	640922749
Product	aspartate-semialdehyde dehydrogenase
Protein accession	YP_001460230
Protein GI	157162912
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0136] Aspartate-semialdehyde dehydrogenase
TIGRFAM ID	[TIGR01745] aspartate-semialdehyde dehydrogenase, gamma-proteobacterial

Plasmid Coverage information

Num covering plasmid clones	56
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAATG TTGGTTTTAT CGGCTGGCGC GGTATGGTCG GCTCCGTTCT CATGCAACGC 
ATGGTTGAAG AGCGCGACTT CGACGCCATT CGCCCTGTCT TCTTTTCTAC TTCTCAGCTT 
GGCCAGGCTG CGCCGTCTTT TGGCGGAACC ACTGGCACAC TTCAGGATGC CTTTGATCTG 
GAGGCGCTAA AGGCCCTCGA TATCATTGTG ACCTGTCAGG GCGGCGATTA TACCAACGAA 
ATCTATCCAA AGCTTCGTGA AAGCGGATGG CAAGGTTACT GGATTGACGC AGCATCGTCT 
CTGCGCATGA AAGATGACGC CATCATCATT CTTGACCCCG TCAATCAGGA CGTCATTACC 
GACGGATTAA ATAATGGCAT CAGGACTTTT GTTGGCGGTA ACTGTACCGT AAGCCTGATG 
TTGATGTCGT TGGGTGGTTT ATTCGCCAAT GATCTTGTTG ATTGGGTGTC CGTTGCAACC 
TACCAGGCCG CTTCCGGCGG TGGTGCGCGA CATATGCGTG AGTTATTAAC CCAGATGGGC 
CATCTGTATG GCCATGTGGC AGATGAACTC GCGACCCCGT CCTCTGCTAT TCTCGATATC 
GAACGCAAAG TCACAACCTT AACCCGTAGC GGTGAGCTGC CGGTGGATAA CTTTGGCGTG 
CCGCTGGCGG GTAGCCTGAT TCCGTGGATC GACAAACAGC TCGATAACGG TCAGAGCCGC 
GAAGAGTGGA AAGGGCAGGC GGAAACCAAC AAGATCCTCA ACACATCTTC CGTAATTCCG 
GTAGATGGTT TATGTGTGCG TGTCGGGGCA TTGCGCTGCC ACAGCCAGGC ATTCACTATT 
AAATTGAAAA AAGATGTGTC TATTCCGACC GTGGAAGAAC TGCTGGCTGC GCACAATCCG 
TGGGCGAAAG TCGTTCCGAA CGATCGGGAA ATCACTATGC GTGAGCTAAC CCCAGCTGCC 
GTTACCGGCA CGCTGACCAC GCCGGTAGGC CGCCTGCGTA AGCTGAATAT GGGACCAGAG 
TTCCTGTCAG CCTTTACAGT GGGCGACCAG CTGCTGTGGG GGGCCGCGGA GCCGCTGCGT 
CGGATGCTTC GTCAACTGGC GTAA

Protein sequence

MKNVGFIGWR GMVGSVLMQR MVEERDFDAI RPVFFSTSQL GQAAPSFGGT TGTLQDAFDL 
EALKALDIIV TCQGGDYTNE IYPKLRESGW QGYWIDAASS LRMKDDAIII LDPVNQDVIT 
DGLNNGIRTF VGGNCTVSLM LMSLGGLFAN DLVDWVSVAT YQAASGGGAR HMRELLTQMG 
HLYGHVADEL ATPSSAILDI ERKVTTLTRS GELPVDNFGV PLAGSLIPWI DKQLDNGQSR 
EEWKGQAETN KILNTSSVIP VDGLCVRVGA LRCHSQAFTI KLKKDVSIPT VEELLAAHNP 
WAKVVPNDRE ITMRELTPAA VTGTLTTPVG RLRKLNMGPE FLSAFTVGDQ LLWGAAEPLR 
RMLRQLA