Gene EcHS_A1453 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1453
Symbol	abgB
ID	5591777
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	1448062
End bp	1449507
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	53%
IMG OID	640920607
Product	aminobenzoyl-glutamate utilization protein B
Protein accession	YP_001458166
Protein GI	157160848
COG category	[R] General function prediction only
COG ID	[COG1473] Metal-dependent amidase/aminoacylase/carboxypeptidase
TIGRFAM ID	[TIGR01891] amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGGAAA TCTATCGTTT TATCGACGAT GCGATTGAAG CCGATCGCCA ACGTTATACC 
GATATTGCCG ATCAAATCTG GGATCATCCA GAAACACGTT TTGAAGAGTT CTGGTCAGCG 
GAGCATCTGG CTTCGGCGCT GGAATCTGCA GGCTTCACCG TTACCCGCAA CGTAGGCAAT 
ATCCCAAATG CCTTTATTGC TTCGTTTGGT CAAGGCAAAC CGGTTATCGC CCTGCTGGGA 
GAATATGACG CCCTGGCAGG TTTAAGTCAG CAAGCAGGTT GCGCGCAACC TACATCCGTG 
ACGCCCGGTG AAAATGGTCA CGGTTGCGGA CACAATTTGC TGGGAACCGC CGCCTTTGCC 
GCTGCAATAG CCGTCAAGAA ATGGCTGGAA CAATATGGGC AAGGCGGCAC GGTGCGCTTT 
TATGGTTGTC CTGGCGAAGA AGGCGGCTCG GGTAAAACGT TCATGGTTCG CGAGGGGGTA 
TTTGATGATG TGGATGCGGC ACTCACCTGG CACCCGGAAG CCTTTGCCGG TATGTTCAAT 
ACCCGCACGC TGGCAAACAT TCAGGCATCA TGGCGCTTTA AAGGGATCGC AGCACATGCC 
GCGAATTCCC CTCATTTGGG ACGCAGCGCC CTTGATGCCG TAACGTTGAT GACCACTGGC 
ACCAACTTCC TCAACGAACA TATTATTGAA AAAGCGCGCG TACACTATGC CATCACAAAT 
AGCGGCGGGA TCTCGCCCAA CGTGGTCCAG GCGCAGGCAG AAGTGCTTTA TCTTATCCGC 
GCCCCCGAAA TGACCGACGT GCAGCATATT TATGATCGGG TCGCCAAAAT CGCCGAAGGT 
GCGGCATTGA TGACCGAAAC CACGGTTGAA TGCCGCTTCG ACAAAGCCTG TTCCAGTTAT 
CTCCCGAATC GCACCTTAGA AAATGCCATG TACCAGGCCC TATCCCATTT TGGTACCCCG 
GAATGGAACT CCGAAGAACT GGCTTTTGCG AAACAAATTC AGGCTACGCT CACCTCCAAC 
GATCGGCAAA ACAGTCTGAA TAATATCGCC GCAACCGGTG GCGAAAACGG CAAGGTTTTT 
GCACTACGTC ATCGTGAAAC GGTACTGGCG AATGAAGTCG CTCCATATGC CGCCACCGAT 
AACGTGCTTG CGGCATCGAC TGATGTCGGC GACGTCAGTT GGAAACTGCC TGTTGCCCAG 
TGTTTCAGCC CCTGTTTTGC CGTCGGTACA CCGCTACATA CGTGGCAACT GGTTAGCCAG 
GGGCGAACAT CTATTGCTCA TAAAGGAATG CTGCTGGCGG CGAAAACTAT GGCAGCAACC 
ACAGTCAATC TCTTCCTTGA TTCAGGGCTA TTGCAAGAAT GCCAACAAGA GCATCAGCAA 
GTAACGGACA CGCAACCGTA TCACTGCCCT ATCCCGAAAA ACGTGACACC GTCACCTTTA 
AAATAA

Protein sequence

MQEIYRFIDD AIEADRQRYT DIADQIWDHP ETRFEEFWSA EHLASALESA GFTVTRNVGN 
IPNAFIASFG QGKPVIALLG EYDALAGLSQ QAGCAQPTSV TPGENGHGCG HNLLGTAAFA 
AAIAVKKWLE QYGQGGTVRF YGCPGEEGGS GKTFMVREGV FDDVDAALTW HPEAFAGMFN 
TRTLANIQAS WRFKGIAAHA ANSPHLGRSA LDAVTLMTTG TNFLNEHIIE KARVHYAITN 
SGGISPNVVQ AQAEVLYLIR APEMTDVQHI YDRVAKIAEG AALMTETTVE CRFDKACSSY 
LPNRTLENAM YQALSHFGTP EWNSEELAFA KQIQATLTSN DRQNSLNNIA ATGGENGKVF 
ALRHRETVLA NEVAPYAATD NVLAASTDVG DVSWKLPVAQ CFSPCFAVGT PLHTWQLVSQ 
GRTSIAHKGM LLAAKTMAAT TVNLFLDSGL LQECQQEHQQ VTDTQPYHCP IPKNVTPSPL 
K