Gene EcolC_2050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2050
Symbol
ID	6067750
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2262577
End bp	2263596
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	45%
IMG OID	641601462
Product	putative dehydrogenase
Protein accession	YP_001725021
Protein GI	170020067
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0249357
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAGCA TATTAATTGA AAAACCGAAT CAACTGGCGA TTGTCGAACG TGAAATACCC 
ACCCCGTCAG CGGGTGAAGT ACGAGTAAAA GTGAAACTTG CCGGAATTTG TGGTTCAGAT 
AGCCATATTT ATCGTGGGCA TAATCCTTTT GCGAAATATC CGTGCGTCAT TGGTCATGAA 
TTCTTTGGCG TCATTGATGC AGTGGGTGAA GGCGTGGAAA GCGCCAGAGT CGGTGAACGT 
GTTGCTGTCG ATCCGGTGGT CAGCTGTGGG CATTGCTATC CGTGCTCTAT AGGTAAACCG 
AACGTTTGTA CGACACTGGC TGTATTAGGT GTGCACGCTG ACGGTGGTTT CAGTGAATAT 
GCCGTGGTTC CGGCAAAAAA TGCGTGGAAA ATTCCTGAAG CAGTGGCCGA TCAATATGCG 
GTAATGATCG AACCTTTTAC CATTGCGGCT AACGTAACCG GACATGGTCA ACCGACTGAA 
AATGATACCG TTCTGGTTTA TGGTGCCGGT CCAATCGGCC TGACGATCGT TCAGGTATTA 
AAAGGCGTCT ATAACGTTAA AAATGTGATT GTTGCCGATC GCATTGATGA ACGACTGGAA 
AAAGCGAAAG AGAGCGGGGC TGACTGGGCG ATTAATAACA GCCAGACACC GCTTGGCGAG 
ATTTTCACTG AAAAAGGCAT CAAGCCGACA TTAATTATCG ATGCGGCTTG TCATCCTTCT 
ATCCTGAAAG AGGCCGTAAC GCTGGCTTCT CCAGCGGCAC GTATTGTATT GATGGGGTTC 
TCCAGTGAAC CGTCTGAAGT GATTCAGCAA GGAATTACCG GAAAAGAACT CTCTATTTTC 
TCTTCACGCT TAAATGCAAA TAAATTCCCG ATCGTTATCG ACTGGTTAAG TAAAGGGTTA 
ATTAAACCAG AAAAATTAAT TACCCATACG TTTGATTTCC AGCATGTTGC TGATGCCATT 
AGTTTATTTG AACAGGATCA AAAACATTGC TGCAAAGTCT TACTCACTTT TTCTGAATAA

Protein sequence

MKSILIEKPN QLAIVEREIP TPSAGEVRVK VKLAGICGSD SHIYRGHNPF AKYPCVIGHE 
FFGVIDAVGE GVESARVGER VAVDPVVSCG HCYPCSIGKP NVCTTLAVLG VHADGGFSEY 
AVVPAKNAWK IPEAVADQYA VMIEPFTIAA NVTGHGQPTE NDTVLVYGAG PIGLTIVQVL 
KGVYNVKNVI VADRIDERLE KAKESGADWA INNSQTPLGE IFTEKGIKPT LIIDAACHPS 
ILKEAVTLAS PAARIVLMGF SSEPSEVIQQ GITGKELSIF SSRLNANKFP IVIDWLSKGL 
IKPEKLITHT FDFQHVADAI SLFEQDQKHC CKVLLTFSE