Gene EcolC_4212 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_4212
Symbol
ID	6067760
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4653708
End bp	4654838
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	55%
IMG OID	641603644
Product	TDP-4-oxo-6-deoxy-D-glucose transaminase
Protein accession	YP_001727136
Protein GI	170022182
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0399] Predicted pyridoxal phosphate-dependent enzyme apparently involved in regulation of cell wall biogenesis
TIGRFAM ID	[TIGR02379] TDP-4-keto-6-deoxy-D-glucose transaminase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCCAT TTAACGCACC GCCGGTGGTG GGAACCGAAC TCGACTATAT GCAGTCGGCA 
ATGGGTAGCG GCAAACTGTG TGGCGATGGC GGTTTTACCC GTCGCTGCCA GCAGTGGCTG 
GAGCAACGTT TTGGCAGCGC CAAAGTGTTA CTGACGCCGT CCTGCACCGC TTCGCTGGAG 
ATGGCGGCGC TGCTGCTCGA TATCCAGCCT GGCGATGAAG TGATCATGCC GAGCTACACC 
TTTGTCTCCA CCGCCAATGC CTTTGTGCTG CGTGGCGCAA AAATCGTTTT TGTGGATGTT 
CGCCCGGACA CCATGAACAT CGACGAAACG CTGATTGAAG CGGCGATCAC CGACAAAACG 
CGCGTTATCG TGCCGGTCCA TTACGCGGGT GTGGCCTGCG AAATGGACAC CATTATGGCG 
TTGGCGAAAA AGCATAATCT TTTTGTGGTG GAAGATGCCG CTCAGGGCGT GATGTCCACT 
TACAAAGGGC GTGCACTGGG AACCATTGGT CATATTGGCT GCTTTAGCTT CCATGAAACC 
AAAAACTACA CGGCGGGTGG TGAAGGCGGC GCGACGCTGA TTAACGATAA AGCGTTAATC 
GAACGAGCCG AGATCATCCG TGAAAAGGGC ACTAACCGCA GCCAGTTCTT CCGTGGTCAG 
GTCGATAAAT ATACCTGGCG CGATATTGGC TCCAGCTATT TGATGTCCGA TCTGCAAGCT 
GCGTACCTGT GGGCGCAACT GGAAGCAGCG GATCGTATCA ACCAGCAACG TCTGGCGCTG 
TGGCAAAACT ACTACGATGC GTTAGCGCCT CTGGCGAAAG CCGGGCGTAT CGAGCTGCCG 
TCGATTCCCG ATGGCTGCGT GCAGAACGCG CATATGTTCT ACATTAAACT GCGGGATATT 
GATGACCGGA GCGCGTTGAT TAACTTTCTG AAAGAAGCGG AAATCATGGC GGTGTTTCAT 
TACATTCCGC TGCACGGTTG CCCTGCGGGG GAACACTTTG GTGAGTTCCA CGGTGAAGAT 
CGCTACACCA CCAAAGAGAG CGAGCGCCTG CTGCGCCTGC CGCTGTTCTA CAACCTGTCG 
CCCGTCAATC AGCGTACGGT AATTGCGACT TTGTTGAACT ACTTCTCCTG A

Protein sequence

MIPFNAPPVV GTELDYMQSA MGSGKLCGDG GFTRRCQQWL EQRFGSAKVL LTPSCTASLE 
MAALLLDIQP GDEVIMPSYT FVSTANAFVL RGAKIVFVDV RPDTMNIDET LIEAAITDKT 
RVIVPVHYAG VACEMDTIMA LAKKHNLFVV EDAAQGVMST YKGRALGTIG HIGCFSFHET 
KNYTAGGEGG ATLINDKALI ERAEIIREKG TNRSQFFRGQ VDKYTWRDIG SSYLMSDLQA 
AYLWAQLEAA DRINQQRLAL WQNYYDALAP LAKAGRIELP SIPDGCVQNA HMFYIKLRDI 
DDRSALINFL KEAEIMAVFH YIPLHGCPAG EHFGEFHGED RYTTKESERL LRLPLFYNLS 
PVNQRTVIAT LLNYFS