Gene EcHS_A0590 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0590
Symbol	allC
ID	5592412
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	603634
End bp	604869
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	52%
IMG OID	640919774
Product	allantoate amidohydrolase
Protein accession	YP_001457357
Protein GI	157160039
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID	[TIGR01879] amidase, hydantoinase/carbamoylase family [TIGR03176] allantoate amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTACAC ATTTTCGTCA AGCCATAGAA GAAGCGCTGC CCTGGCTTTC CTCTTTTGGC 
GCTGACCCAA CGGGTGGGAT GACCCGTTTA CTTTATTCGC CGGAATGGCT GGAAACCCAG 
CAGCAATTTA AAAAAAGAAT GGCAGCAAGT GGGCTGGAAA CACGTTTCGA TGAAGTAGGG 
AATTTATACG GTCGCCTGAA TGGTACCGAA TATCCACAGG AAGTGATTCT GAGCGGTTCG 
CATATCGATA CCGTGGTTAA CGGCGGTAAC CTCGACGGGC AATTCGGCGC GCTGGCGGCG 
TGGCTGGCAA TTGACTGGCT GAAAACGCAA TACGGCGCAC CGTTACGTAC GGTCGAAGTG 
GTGGCGATGG CAGAAGAAGA AGGCAGCCGC TTCCCGTATG TCTTCTGGGG CAGTAAAAAT 
ATCTTTGGGC TGGCGAATCC TGACGACGTG CGGAATATCT GTGATGCCAA AGGAAATAGT 
TTTGTCGATG CGATGAAGGC TTGCGGATTT ACTCTGCCGG ACGCCCCGCT AACTCCGCGT 
CAGGATATTA AAGCCTTTGT CGAACTGCAT ATCGAACAGG GCTGTGTGCT GGAAAGTAAT 
GGGCAATCAA TTGGCGTGGT GAATGCAATT GTCGGGCAAC GTCGCTATAC GGTGACGCTG 
AACGGCGAAT CAAACCATGC AGGCACCACG CCGATGGGTT ATCGTCGTGA TACGGTTTAC 
GCTTTCAGTC GCATTTGCCA TCAGTCGATC GAAAAAGCGA AAAAGATGGG CGATCCGCTG 
GTTCTGACCT TTGGGAAAGT AGAGCCGCGC CCGAATACGG TGAATGTGGT GCCGGGTAAA 
ACCACGTTCA CCATTGATTG TCGTCATACC GACGCCGCCG TGCTGCGTGA TTTCACCCAA 
CAGTTAGAAA ACGACATGCG GGCGATTTGC GATGAAATGG ACATTGGTAT TGATATCGAT 
TTATGGATGG ACGAAGAACC CGTGCCGATG AATAAGGACC TGGTCGCCAC CCTGACAGAA 
TTGTGTGAAA GTGAAAAACT GAATTACCGG GTGATGCACA GTGGTGCCGG GCACGACGCG 
CAAATTTTCG CGCCTCGCGT GCCGACCTGC ATGATTTTCA TTCCCAGCAT CAACGGGATC 
AGCCATAACC CGGCGGAACG CACCAATATT ACCGACCTTG CCGAAGGGGT CAAAACGTTG 
GCACTCATGC TTTATCAACT TGCCTGGCAG AAATAA

Protein sequence

MITHFRQAIE EALPWLSSFG ADPTGGMTRL LYSPEWLETQ QQFKKRMAAS GLETRFDEVG 
NLYGRLNGTE YPQEVILSGS HIDTVVNGGN LDGQFGALAA WLAIDWLKTQ YGAPLRTVEV 
VAMAEEEGSR FPYVFWGSKN IFGLANPDDV RNICDAKGNS FVDAMKACGF TLPDAPLTPR 
QDIKAFVELH IEQGCVLESN GQSIGVVNAI VGQRRYTVTL NGESNHAGTT PMGYRRDTVY 
AFSRICHQSI EKAKKMGDPL VLTFGKVEPR PNTVNVVPGK TTFTIDCRHT DAAVLRDFTQ 
QLENDMRAIC DEMDIGIDID LWMDEEPVPM NKDLVATLTE LCESEKLNYR VMHSGAGHDA 
QIFAPRVPTC MIFIPSINGI SHNPAERTNI TDLAEGVKTL ALMLYQLAWQ K