Gene EcHS_A0760 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0760
Symbol
ID	5594724
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	770323
End bp	771255
Gene Length	933 bp
Protein Length	310 aa
Translation table	11
GC content	56%
IMG OID	640919936
Product	allophanate hydrolase, subunit 2
Protein accession	YP_001457510
Protein GI	157160192
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1984] Allophanate hydrolase subunit 2
TIGRFAM ID	[TIGR00724] biotin-dependent carboxylase uncharacterized domain

Plasmid Coverage information

Num covering plasmid clones	55
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGAAGA TTATTCGTGC GGGCATGTAT ACCACTGTGC AGGATGGCGG TCGTCACGGT 
TTTCGCCAGT CGGGTATCAG CCACTGCGGC GCACTGGATA TGCCCGCGTT ACGCATTGCT 
AACCTACTGG TGGGTAATGA CGCCAATGCC CCCGCGCTGG AGATCACGCT CGGTCAGTTA 
ACTGTTGAGT TCGAAACTGA TGGGTGGTTT GCTCTGACGG GTGCCGGTTG CGAAGCGCGG 
CTGGATGATA ATGCCGTCTG GACCGGCTGG CGATTGCCGA TGAAAGCAGG CCAGCGTTTA 
ACGCTTAAAC GCCCGCAGCA CGGGATGCGC AGTTATCTGG CGGTCGCGGG TGGTATTGAT 
GTTCCGCCGG TAATGGGCTC ATGCAGCACC GATCTCAAAG TGGGGATTGG CGGGCTGGAA 
GGCCGTTTAC TGAAGGATGG TGACCGACTC CCGATTGGCA AATCGAAGCG TGATTCTATG 
GAAGCGCAGG GCGTTAAACA GCTGCTGTGG GGCAACCGCA TTCGCGCCTT GCCGGGGCCG 
GAATATCATG AGTTCGATCG CGCCTCGCAG GATGCATTCT GGCGTTCGCC CTGGCAGCTT 
AGCTCGCAAA GTAACCGCAT GGGCTATCGC TTACAGGGGC AAATTTTAAA ACGCACCACC 
GATCGCGAAC TGTTATCTCA CGGTTTGTTA CCGGGCGTGG TGCAGGTGCC ACATAACGGG 
CAGCCGATTG TGTTGATGAA CGACGCACAG ACCACCGGTG GTTACCCGCG TATTGCCTGT 
ATCATTGAGG CTGATATGTA CCATCTGGCG CAAATTCCGC TCGGTCAGCC GATTCATTTT 
GTCCAGTGTT CACTGGAAGA GGCACTGAAA GCGCGGCAAG ATCAGCAACG TTATTTTGAA 
CAATTAGCGT GGCGGCTGCA CAATGAAAAT TGA

Protein sequence

MLKIIRAGMY TTVQDGGRHG FRQSGISHCG ALDMPALRIA NLLVGNDANA PALEITLGQL 
TVEFETDGWF ALTGAGCEAR LDDNAVWTGW RLPMKAGQRL TLKRPQHGMR SYLAVAGGID 
VPPVMGSCST DLKVGIGGLE GRLLKDGDRL PIGKSKRDSM EAQGVKQLLW GNRIRALPGP 
EYHEFDRASQ DAFWRSPWQL SSQSNRMGYR LQGQILKRTT DRELLSHGLL PGVVQVPHNG 
QPIVLMNDAQ TTGGYPRIAC IIEADMYHLA QIPLGQPIHF VQCSLEEALK ARQDQQRYFE 
QLAWRLHNEN