Gene EcolC_2270 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2270
Symbol
ID	6067018
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2501873
End bp	2503372
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	53%
IMG OID	641601674
Product	phenylacetaldehyde dehydrogenase
Protein accession	YP_001725233
Protein GI	170020279
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGAGC CGCATGTAGC AGTATTAAGC CAGGTCCAAC AGTTTCTCGA TCGTCAACAC 
GGTCTTTATA TTGATGGTCG TCCTGGCCCC GCACAAAGTG AAAAACGGTT GGCGATCTTT 
GATCCGGCCA CCGGGCAAGA AATTGCGTCT ACTGCTGATG CCAACGAAGC GGATGTAGAT 
AACGCAGTCA TGTCTGCCTG GCGGGCCTTT GTCTCGCGTC GCTGGGCCGG GCGATTACCC 
GCAGAGCGTG AACGTATTCT GCTACGTTTT GCTGATCTGG TGGAGCAGCA CAGTGAGGAG 
CTGGCGCAAC TGGAAACCCT GGAGCAAGGC AAGTCAATTG CCATTTCCCG TGCTTTTGAA 
GTGGGCTGTA CGCTGAACTG GATGCGTTAT ACCGCCGGGT TAACGACCAA AATCGCGGGT 
AAAACGCTGG ACTTGTCGAT TCCCTTACCC CAGGGGGCGC GTTATCAGGC CTGGACGCGT 
AAAGAGCCGG TTGGCGTGGT AGCGGGAATT GTGCCATGGA ACTTTCCGTT GATGATTGGC 
ATGTGGAAGG TGATGCCAGC ACTGGCAGCA GGCTGTTCAA TCGTGATTAA GCCTTCGGAA 
ACCACGCCAC TGACGATGTT GCGCGTGGCG GAACTGGCCA GCGAGGCTGG TATCCCTGAT 
GGCGTTTTTA ATGTCGTCAC CGGGTCAGGT GCTGTATGCG GCGCGGCCCT GACGTCACAT 
CCTCATGTTG CGAAAATCAG TTTTACCGGT TCAACCGCGA CGGGAAAAGG TATTGCCAGA 
ACTGCTGCTG ATCGCTTAAC GCGTGTAACG CTGGAACTGG GCGGTAAAAA CCCGGCAATT 
GTATTAAAAG ATGCTGATCC GCAATGGGTT ATTGAAGGCT TGATGACCGG AAGCTTCCTG 
AATCAAGGGC AAGTATGCGC CGCCAGTTCG CGAATTTATA TTGAAGCGCC GTTGTTTGAC 
ACGCTGGTTA GTGGATTTGA GCAGGCGGTA AAATCGTTGC AAGTGGGACC GGGGATGTCA 
CCTGTTGCAC AGATTAACCC TTTGGTTTCT CGTGCGCACT GCGGCAAAGT GTGTTCATTC 
CTCGACGATG CGCAGGCACA GCAAGCAGAG CTGATTCGCG GATCGAATGG ACCAGCCGGA 
GAGGGGTATT ATGTTGCGCC AACGCTGGTG GTAAATCCCG ATGCTAAATT GCGCTTAACT 
CGTGAAGAGG TGTTTGGTCC GGTGGTTAAC CTGGTGCGAG TAGCGGATGG AGAAGAGGCG 
TTACAACTGG CAAACGACAC GGAATATGGC TTAACTGCCA GTGTCTGGAC GCAAAATCTC 
TCCCAGGCTC TGGAATATAG CGATCGCTTA CAGGCAGGGA CGGTGTGGGT AAACAGTCAT 
ACCTTAATTG ACGCTAACTT ACCGTTTGGT GGGATGAAGC AGTCAGGAAC AGGCCGTGAT 
TTTGGCCCCG ACTGGCTGGA CGGTTGGTGT GAAACTAAGT CGGTGTGTGT ACGGTATTAA

Protein sequence

MTEPHVAVLS QVQQFLDRQH GLYIDGRPGP AQSEKRLAIF DPATGQEIAS TADANEADVD 
NAVMSAWRAF VSRRWAGRLP AERERILLRF ADLVEQHSEE LAQLETLEQG KSIAISRAFE 
VGCTLNWMRY TAGLTTKIAG KTLDLSIPLP QGARYQAWTR KEPVGVVAGI VPWNFPLMIG 
MWKVMPALAA GCSIVIKPSE TTPLTMLRVA ELASEAGIPD GVFNVVTGSG AVCGAALTSH 
PHVAKISFTG STATGKGIAR TAADRLTRVT LELGGKNPAI VLKDADPQWV IEGLMTGSFL 
NQGQVCAASS RIYIEAPLFD TLVSGFEQAV KSLQVGPGMS PVAQINPLVS RAHCGKVCSF 
LDDAQAQQAE LIRGSNGPAG EGYYVAPTLV VNPDAKLRLT REEVFGPVVN LVRVADGEEA 
LQLANDTEYG LTASVWTQNL SQALEYSDRL QAGTVWVNSH TLIDANLPFG GMKQSGTGRD 
FGPDWLDGWC ETKSVCVRY