Gene EcolC_2943 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2943
Symbol
ID	6065584
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	3210050
End bp	3210982
Gene Length	933 bp
Protein Length	310 aa
Translation table	11
GC content	56%
IMG OID	641602355
Product	urea amidolyase related protein
Protein accession	YP_001725897
Protein GI	170020943
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1984] Allophanate hydrolase subunit 2
TIGRFAM ID	[TIGR00724] biotin-dependent carboxylase uncharacterized domain

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGAAGA TTATTCGTGC GGGCATGTAT ACCACTGTGC AGGATGGCGG TCGTCACGGT 
TTTCGCCAGT CGGGTATCAG CCACTGCGGC GCACTGGATA TGCCCGCGTT ACGCATTGCT 
AACCTACTGG TGGGTAATGA CGCCAATGCC CCCGCGCTGG AGATCACGCT CGGTCAGTTA 
ACTGTTGAGT TCGAAACTGA TGGGTGGTTT GCTCTGACGG GTGCCGGTTG CGAAGCGCGG 
CTGGATGATA ATGCCGTCTG GACCGGCTGG CGATTGCCGA TGAAAGCAGG CCAGCGTTTA 
ACGCTTAAAC GCCCGCAGCA CGGGATGCGC AGTTATCTGG CGGTCGCGGG TGGTATTGAT 
GTTCCGCCGG TAATGGGCTC ATGCAGCACC GATCTCAAAG TGGGGATTGG CGGGCTGGAA 
GGCCGTTTAC TGAAGGATGG TGACCGACTC CCGATTGGCA AATCGAAGCG TGATTCTATG 
GAAGCGCAGG GCGTTAAACA GCTGCTGTGG GGCAACCGCA TTCGCGCCTT GCCGGGGCCG 
GAATATCATG AGTTCGATCG CGCCTCGCAG GATGCATTCT GGCGTTCGCC CTGGCAGCTT 
AGCTCGCAAA GTAACCGCAT GGGCTATCGC TTACAGGGGC AAATTTTAAA ACGCACCACC 
GATCGCGAAC TGTTATCTCA CGGTTTGTTA CCGGGCGTGG TGCAGGTGCC ACATAACGGG 
CAGCCGATTG TGTTGATGAA CGACGCACAG ACCACCGGTG GTTACCCGCG TATTGCCTGT 
ATCATTGAGG CTGATATGTA CCATCTGGCG CAAATTCCGC TCGGTCAGCC GATTCATTTT 
GTCCAGTGTT CACTGGAAGA GGCACTGAAA GCGCGGCAAG ATCAGCAACG TTATTTTGAA 
CAATTAGCGT GGCGGCTGCA CAATGAAAAT TGA

Protein sequence

MLKIIRAGMY TTVQDGGRHG FRQSGISHCG ALDMPALRIA NLLVGNDANA PALEITLGQL 
TVEFETDGWF ALTGAGCEAR LDDNAVWTGW RLPMKAGQRL TLKRPQHGMR SYLAVAGGID 
VPPVMGSCST DLKVGIGGLE GRLLKDGDRL PIGKSKRDSM EAQGVKQLLW GNRIRALPGP 
EYHEFDRASQ DAFWRSPWQL SSQSNRMGYR LQGQILKRTT DRELLSHGLL PGVVQVPHNG 
QPIVLMNDAQ TTGGYPRIAC IIEADMYHLA QIPLGQPIHF VQCSLEEALK ARQDQQRYFE 
QLAWRLHNEN