Gene EcolC_0572 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0572
Symbol
ID	6066119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	613812
End bp	615383
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	53%
IMG OID	641599979
Product	galactarate dehydratase
Protein accession	YP_001723576
Protein GI	170018622
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2721] Altronate dehydratase
TIGRFAM ID	[TIGR03248] galactarate dehydratase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAACA TCGAAATCAG ACAAGAAACG CCAACTGCGT TTTATATAAA AGTTCACGAC 
ACAGATAATG TGGCAATTAT TGTTAATGAT AATGGCCTGA AAGCAGGAAC GCGTTTTCCG 
GATGGGCTGG AATTAATTGA ACATATTCCC CAGGGGCATA AAGTCGCATT GCTGGACATT 
CCGGCTAATG GTGAAATTAT TCGTTATGGC GAAGTGATTG GTTACGCCGT GCGTGCAATC 
CCACGCGGAA GCTGGATCGA CGAATCAATG GTTGTACTAC CGGAAGCGCC GCCGTTACAC 
ACGCTGCCAC TGGCAACCAA AGTCCCGGAA CCCTTACCGC CGCTGGAAGG ATACACCTTT 
GAGGGCTATC GCAATGCCGA TGGCAGCGTG GGCACCAAAA ACCTGCTCGG CATCACCACC 
AGCGTCCACT GTGTGGCAGG CGTGGTGGAC TACGTAGTAA AAATCATTGA ACGCGATCTG 
CTACCGAAAT ACCCGAACGT CGATGGCGTG GTGGGGCTGA ATCATTTGTA CGGTTGTGGC 
GTGGCGATTA ACGCACCGGC GGCAGTTGTG CCTATTCGTA CCATTCACAA TATTTCGCTG 
AACCCTAACT TTGGCGGCGA AGTAATGGTG ATTGGCCTGG GTTGTGAAAA GTTGCAGCCT 
GAGCGCCTGC TGACTGGAAC GGATGATGTG CAAGCTATTC CAGTAGAAAG CGCCAGCATT 
GTCAGTTTGC AGGATGAAAA GCATGTCGGT TTTCAGTCCA TGGTCGAGGA TATTTTGCAG 
GTCGCCGAAC GCCATCTACA AAAACTGAAT CAACGTCAGC GAGAAACCTG TCCGGCTTCA 
GAACTGGTTG TCGGCATGCA GTGCGGTGGC AGCGATGCCT TTTCTGGCGT AACGGCAAAC 
CCGGCGGTTG GGTATGCGTC TGATCTACTG GTGCGCTGCG GCGCAACGGT GATGTTCTCA 
GAAGTCACGG AAGTGCGTGA CGCGATCCAT CTGCTGACAC CACGCGCAGT GAACGAAGAG 
GTCGGCAAAC GGCTGCTGGA GGAGATGGAG TGGTACGATA ACTATCTCAA TATAGGAAAA 
ACCGACCGCA GCGCCAACCC TTCGCCGGGC AACAAGAAAG GCGGTCTGGC AAACGTGGTA 
GAGAAGGCAC TCGGCTCCAT TGCTAAATCG GGTAAAAGCG CAATTGTTGA AGTGCTGTCG 
CCCGGTCAAC GCCCGACTAA ACGCGGATTA ATTTACGCCG CGACGCCAGC CAGCGATTTT 
GTCTGTGGCA CGCAACAGGT GGCTTCGGGT ATCACAGTGC AAGTGTTTAC GACCGGCCGT 
GGTACGCCGT ACGGCCTGAT GGCGGTACCC GTCATTAAAA TGGCGACCCG CACCGAGCTG 
GCGAACCGCT GGTTTGATTT AATGGATATT AACGCGGGCA CTATCGCCAC CGGCGAAGAA 
ACCATTGAAG AGGTGGGCTG GAAGTTGTTC CACTTTATTC TCGACGTCGC CAGCGGGAAG 
AAGAAAACCT TCTCGGATCA ATGGGGGCTG CATAACCTGC TGGCGGTGTT TAACCCGGCA 
CCGGTGACCT GA

Protein sequence

MANIEIRQET PTAFYIKVHD TDNVAIIVND NGLKAGTRFP DGLELIEHIP QGHKVALLDI 
PANGEIIRYG EVIGYAVRAI PRGSWIDESM VVLPEAPPLH TLPLATKVPE PLPPLEGYTF 
EGYRNADGSV GTKNLLGITT SVHCVAGVVD YVVKIIERDL LPKYPNVDGV VGLNHLYGCG 
VAINAPAAVV PIRTIHNISL NPNFGGEVMV IGLGCEKLQP ERLLTGTDDV QAIPVESASI 
VSLQDEKHVG FQSMVEDILQ VAERHLQKLN QRQRETCPAS ELVVGMQCGG SDAFSGVTAN 
PAVGYASDLL VRCGATVMFS EVTEVRDAIH LLTPRAVNEE VGKRLLEEME WYDNYLNIGK 
TDRSANPSPG NKKGGLANVV EKALGSIAKS GKSAIVEVLS PGQRPTKRGL IYAATPASDF 
VCGTQQVASG ITVQVFTTGR GTPYGLMAVP VIKMATRTEL ANRWFDLMDI NAGTIATGEE 
TIEEVGWKLF HFILDVASGK KKTFSDQWGL HNLLAVFNPA PVT