Gene EcolC_2842 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2842
Symbol
ID	6065144
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	3108964
End bp	3110049
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	56%
IMG OID	641602248
Product	hypothetical protein
Protein accession	YP_001725797
Protein GI	170020843
COG category	[C] Energy production and conversion
COG ID	[COG2055] Malate/L-lactate dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0746
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAGTG GTCATCGCTT TGATGCTCAG ACGCTGCACA GTTTTATTCA GGCTGTATTT 
CGTCAGATGG GTAGCGAGGA ACAAGAAGCG AAATTAGTTG CCGATCATTT AATCGCGGCA 
AACCTGGCAG GGCATGATTC ACATGGTATT GGCATGATCC CAAGCTATGT ACGCTCCTGG 
AGTCAGGGGC ACCTGCAAAT TAACCATCAT GCCAAAACCG TTAAAGAGGC GGGGGCGGCG 
GTCACGCTCG ATGGCGATCG CGCATTTGGT CAGGTCGCGG CACATGAAGC GATGGCGCTG 
GGGATTGAGA AAGCGCATCA GCACGGTATT GCCGCCGTGG CGCTACATAA CTCGCATCAT 
ATCGGCCGTA TCGGTTACTG GGCGGAGCAG TGTGCAGCGG CGGGGTTTGT CTCTATCCAC 
TTTGTTAGCG TGGTCGGTAT TCCAATGGTC GCGCCGTTCC ACGGTCGCGA CAGCCGCTTT 
GGCACCAATC CGTTCTGTGT GGTTTTCCCT CGTAAAGATA ATTTCCCGCT GTTGCTTGAT 
TACGCCACCA GCGCCATTGC ATTTGGCAAA ACCCGCGTCG CCTGGCATAA AGGCGTCCCC 
GTGCCGCCAG GTTGCCTGAT TGACGTTAAC GGCGTGCCGA CGACCAATCC GGCGGTAATG 
CAGGAGTCGC CGTTGGGTTC GCTGTTGACC TTTGCCGAAC ATAAAGGCTA CGCCCTTGCA 
GCGATGTGTG AAATTCTTGG CGGGGCGCTT TCCGGCGGTA AAACGACGCA TCAGGAAACG 
TTACAAACCA GTCCCGATGC CATTCTTAAC TGCATGACCA CTATCATCAT CAACCCGGAA 
CTCTTCGGCG CGCCGGATTG TAACGCGCAG ACCGAAGCCT TTGCCGAGTG GGTGAAAGCC 
TCGCCGCATG ATGATGATAA GCCGATTTTG CTACCGGGCG AGTGGGAAGT GAACACGCGT 
CGCGAACGGC AGAAGCAGGG GATTCCACTG GATGCGGGAA GCTGGCAGGC CATTTGTGAT 
GCAGCGCGGC AGATTGGTAT GCCGGAAGAG ACGTTGCAGG CTTTCTGTCA GCAGTTAGCC 
AGCTAA

Protein sequence

MESGHRFDAQ TLHSFIQAVF RQMGSEEQEA KLVADHLIAA NLAGHDSHGI GMIPSYVRSW 
SQGHLQINHH AKTVKEAGAA VTLDGDRAFG QVAAHEAMAL GIEKAHQHGI AAVALHNSHH 
IGRIGYWAEQ CAAAGFVSIH FVSVVGIPMV APFHGRDSRF GTNPFCVVFP RKDNFPLLLD 
YATSAIAFGK TRVAWHKGVP VPPGCLIDVN GVPTTNPAVM QESPLGSLLT FAEHKGYALA 
AMCEILGGAL SGGKTTHQET LQTSPDAILN CMTTIIINPE LFGAPDCNAQ TEAFAEWVKA 
SPHDDDKPIL LPGEWEVNTR RERQKQGIPL DAGSWQAICD AARQIGMPEE TLQAFCQQLA 
S