Gene EcolC_0638 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0638
Symbol
ID	6066378
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	688534
End bp	689445
Gene Length	912 bp
Protein Length	303 aa
Translation table	11
GC content	54%
IMG OID	641600045
Product	tartrate dehydratase subunit alpha
Protein accession	YP_001723641
Protein GI	170018687
COG category	[C] Energy production and conversion
COG ID	[COG1951] Tartrate dehydratase alpha subunit/Fumarate hydratase class I, N-terminal domain
TIGRFAM ID	[TIGR00722] hydro-lyases, Fe-S type, tartrate/fumarate subfamily, alpha region

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.000169351
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAGCG AAAGTAATAA GCAACAGGCA GTGAATAAGT TGACAGAGAT TGTCGCTAAC 
TTTACCGCCA TGATTTCTAC CCGAATGCCT GATGACGTGG TGGATAAACT AAAACAGCTA 
AAGGATGCCG AAACGTCGTC GATGGGGAAA ATTATCTACC ATACGATGTT CGACAACATG 
CAAAAAGCGA TTGACCTGAA TCGTCCTGCC TGTCAGGACA CCGGGGAGAT TATGTTCTTC 
GTTAAAGTCG GTTCCCGCTT CCCACTGCTT GGCGAGCTGC AAAGCATACT CAAACAAGCC 
GTGGAAGAGG CAACCGTCAA AGCGCCACTA CGTCACAATG CGGTAGAAAT TTTTGACGAA 
GTAAACACCG GCAAAAATAC CGGTAGCGGC GTACCGTGGG TCACCTGGGA CATCATCCCC 
GACAATGACG ATGCGGAAAT CGAAGTTTAC ATGGCAGGCG GCGGCTGCAC GCTACCTGGC 
CGCTCGAAAG TGTTAATGCC GTCAGAAGGC TACGAAGGCG TGGTGAAATT CGTCTTCGAA 
AATATCTCCA CCCTCGCCGT AAACGCCTGT CCACCGGTAC TGGTGGGCGT GGGCATCGCC 
ACCTCGGTGG AAACCGCCGC CGTACTCTCG CGTAAAGCCA TTTTGCGCCC GATTGGCAGC 
CGCCATCCCA ATCCAAAAGC GGCAGAACTG GAGCTACGCC TGGAAGAAGG ACTCAACCGT 
CTGGGGATTG GTCCACAAGG GCTGACCGGC AACAGTTCAG TGATGGGCGT ACATATCGAA 
TCTGCCGCCC GCCATCCGTC AACCATCGGC GTTGCTGTCT CTACCGGCTG CTGGGCGCAT 
CGTCGCGGCA CGCTGCTGGT TCATGCCGAT CTCACCTTTG AAAATCTGTC TCACACCCGG 
AGCGCGTTAT GA

Protein sequence

MMSESNKQQA VNKLTEIVAN FTAMISTRMP DDVVDKLKQL KDAETSSMGK IIYHTMFDNM 
QKAIDLNRPA CQDTGEIMFF VKVGSRFPLL GELQSILKQA VEEATVKAPL RHNAVEIFDE 
VNTGKNTGSG VPWVTWDIIP DNDDAEIEVY MAGGGCTLPG RSKVLMPSEG YEGVVKFVFE 
NISTLAVNAC PPVLVGVGIA TSVETAAVLS RKAILRPIGS RHPNPKAAEL ELRLEEGLNR 
LGIGPQGLTG NSSVMGVHIE SAARHPSTIG VAVSTGCWAH RRGTLLVHAD LTFENLSHTR 
SAL