Gene EcolC_2006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2006
Symbol
ID	6068085
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2212367
End bp	2213407
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	53%
IMG OID	641601420
Product	putative oxidoreductase
Protein accession	YP_001724979
Protein GI	170020025
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00151609
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.380811
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACA ACATCCGTGT TGGGTTGATT GGGTATGGTT ATGCGAGCAA AACCTTCCAT 
GCGCCCCTGA TTGCGGGCAC GCCCGGGCTG GAACTGGCGG TAATCTCCAG CAGTGATGAA 
ACAAAAGTAA AAGCCGACTG GCCAACGGTT ACGGTTGTCT CTGAGCCGAA GCATCTGTTT 
AACGATCCCA ACATAGACCT GATTGTCATT CCTACACCCA ACGATACCCA TTTCCCGTTA 
GCCAAAGCGG CGCTTGAGGC GGGTAAACAT GTGGTCGTTG ATAAACCCTT TACCGTGACA 
CTGTCACAAG CGCGAGAGCT GGATGCGCTG GCAAAAAGCC TGGGGCGTGT GCTGTCTGTA 
TTCCATAACC GTCGCTGGGA TAGCGATTTC TTGACGCTAA AAGGTTTACT CGCGGAAGGC 
GTGCTGGGTG AAGTTGCTTA CTTTGAGTCT CATTTTGACC GCTTCCGTCC GCAGGTGCGC 
GATCGTTGGC GTGAACAGGG CGGCCCAGGC AGCGGTATCT GGTACGATTT AGCACCACAT 
CTTCTTGATC AGGCCATTAC GCTTTTTGGT TTACCGGTCA GCATGACGGT AGATTTGGCA 
CAGTTACGGC CCGGAGCGCA GTCGACCGAT TATTTCCACG CCATCTTGTC CTATCCACAG 
CGGCGAGTCA TTTTACACGG TACCATGCTG GCAGCCGCTG AGTCAGCACG GTATATCGTG 
CATGGATCCC GAGGCAGTTA TGTGAAATAT GGCCTCGATC CACAGGAAGA ACGTCTGAAA 
AATGGCGAGC GTCTACCGCA GGAAGACTGG GGCTACGATA TGCGTGATGG CGTACTTACC 
CGCGTGGAAG GTGAGGAACG TGTCGAAGAA ACGCTGTTGA CGGTGCCTGG GAATTATCCG 
GCTTACTATG CGGCTATTCG TGATGCGTTA AATGGCGATG GTGAAAATCC GGTTCCGGCA 
AGCCAGGCAA TCCAGGTAAT GGAGTTGATT GAGCTGGGCA TCGAATCCGC CAAACATCGC 
GCGACTTTGT GCCTTGCATG A

Protein sequence

MSDNIRVGLI GYGYASKTFH APLIAGTPGL ELAVISSSDE TKVKADWPTV TVVSEPKHLF 
NDPNIDLIVI PTPNDTHFPL AKAALEAGKH VVVDKPFTVT LSQARELDAL AKSLGRVLSV 
FHNRRWDSDF LTLKGLLAEG VLGEVAYFES HFDRFRPQVR DRWREQGGPG SGIWYDLAPH 
LLDQAITLFG LPVSMTVDLA QLRPGAQSTD YFHAILSYPQ RRVILHGTML AAAESARYIV 
HGSRGSYVKY GLDPQEERLK NGERLPQEDW GYDMRDGVLT RVEGEERVEE TLLTVPGNYP 
AYYAAIRDAL NGDGENPVPA SQAIQVMELI ELGIESAKHR ATLCLA