Gene EcE24377A_0342 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_0342
Symbol
ID	5587877
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	372238
End bp	373482
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	56%
IMG OID	640924067
Product	putative deaminase
Protein accession	YP_001461495
Protein GI	157155685
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATCA CTGACCCGCA TTACTATCTC GACAACGTGC TACTGGAAAC CGGTTTTGAC 
TACGAAAACG GTGTGGCGGT ACAGACCCGC ACGGCGCGCC AGACCGTGGA GATTCAAAAC 
GGCAAAATTG TTGCCCTGCG CGAGAACAAG CAGCATCCGG ACGCCACGCT GCCGCACTAT 
GATGCTGGCG GTAAGCTGAT GCTGCCCACC ACTCGCGATA TGCATATTCA TCTCGACAAA 
ACCTTCTACG GCGGGCCGTG GCGCTCGCTC AATCGTCCGG CAGGCACCAC CATCCAGGAC 
ATGATCAAGC TTGAGCAGAA AATGCTGCCG GAACTGCAAC CGTACACGCA GGAACGGGCA 
GAAAAACTGA TCGATCTATT GCAGTCGAAA GGCACCACCA TTGCCCGCAG CCACTGCAAT 
ATCGAACCGG TTTCCGGCCT AAAAAATCTG CAAAATTTGC AGGCGGTGCT GGCGCGGCGT 
CAGGCGGGCT TCGAGTGTGA AATCGTCGCC TTCCCGCAGC ACGGTTTGCT GCTGTCGAAA 
TCGGAACCCT TAATGCGCGA AGCGATGCAG GCGGGTGCGC ATTACGTCGG CGGGCTGGAC 
CCGACCAGTG TCGATGGCGC GATGGAAAAA TCCCTCGACA CCATGTTTCA GATTGCGCTG 
GACTACGACA AAGGTGTCGA TATTCACCTG CACGAAACCA CTCCGTCGGG CGTGGCAGCC 
ATCAATTATA TGGTTGAAAC GGTAGAGAAA ACGCCGCAAC TGAAAGGTAA GCTGACCATC 
AGCCACGCCT TTGCGCTGGC TACGCTCAAC GAACAACAGG TCGATGCGCT GGCGAATCGG 
ATGGCGGCGC AGCAAATTTC TATCGCCTCG ACGGTGCCGA TTGGCACGCT GCATATGCCG 
CTCAAACAGT TGCACGACAA AGGCGTAAAA GTGATGACTG GCACTGACAG CGTTATCGAC 
CACTGGTCGC CTTATGGTCT GGGCGACATG CTGGAAAAAG CCAATCTCTA CGCGCAGCTC 
TATATTCGTC CTAACGAACA GAACCTCTCC CGTTCGCTGT TTCTAGCCAC TGGCGATGTA 
TTGCCGCTGA ATGAAAAAGG CGAGCGTGTA TGGCCAAAAG CGCAGGATGA TGCCAGCTTT 
GTGCTGGTGG ACGCCTCCTG TTCCGCCGAG GCGGTGGCGC GTATCTCGCC GAGAACCGCA 
ACGTTCCATA AAGGGCAACT GGTGTGGGGG AGTGTGGCAG GTTGA

Protein sequence

MKITDPHYYL DNVLLETGFD YENGVAVQTR TARQTVEIQN GKIVALRENK QHPDATLPHY 
DAGGKLMLPT TRDMHIHLDK TFYGGPWRSL NRPAGTTIQD MIKLEQKMLP ELQPYTQERA 
EKLIDLLQSK GTTIARSHCN IEPVSGLKNL QNLQAVLARR QAGFECEIVA FPQHGLLLSK 
SEPLMREAMQ AGAHYVGGLD PTSVDGAMEK SLDTMFQIAL DYDKGVDIHL HETTPSGVAA 
INYMVETVEK TPQLKGKLTI SHAFALATLN EQQVDALANR MAAQQISIAS TVPIGTLHMP 
LKQLHDKGVK VMTGTDSVID HWSPYGLGDM LEKANLYAQL YIRPNEQNLS RSLFLATGDV 
LPLNEKGERV WPKAQDDASF VLVDASCSAE AVARISPRTA TFHKGQLVWG SVAG