Gene EcolC_2133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2133
Symbol
ID	6065295
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2329165
End bp	2330553
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	53%
IMG OID	641601541
Product	putative succinate semialdehyde dehydrogenase
Protein accession	YP_001725100
Protein GI	170020146
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.753
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATTA CTCCGGCAAC TCATGCAATT TCGATAAATC CTGCCACGGG TGAACAACTT 
TCTGTGCTGC CGTGGGCTGG CGCTGACGAT ATCGAAAACG CACTTCAGCT GGCGGCAGCA 
GGCTTTCGCG ACTGGCGCGA GACAAATATA GATTATCGTG CTGAAAAACT GCGTGATATC 
GGTAAGGCTC TGCGCGCTCG TAGCGAAGAA ATGGCGCAAA TGATCACCCG CGAAATGGGC 
AAACCAATCA ACCAGGCGCG CGCTGAAGTG GCGAAATCGG CGAATTTGTG TGACTGGTAT 
GCAGAACATG GTCCGGCAAT GCTGAAGGCG GAACCTACGC TGGTGGAAAA TCAGCAGGCG 
GTTATTGAGT ATCGACCGTT GGGGACGATT CTGGCGATTA TGCCGTGGAA TTTTCCGTTA 
TGGCAGGTGA TGCGTGGCGC TGTTCCCATC ATTCTTGCAG GTAACGGCTA CTTACTTAAA 
CATGCGCCGA ATGTGATGGG CTGTGCACAG CTCATTGCCC AGGTGTTTAA AGATGCGGGT 
ATCCCACAAG GCGTATATGG CTGGCTGAAT GCCGACAACG ACGGTGTCAG TCAGATGATT 
AAAGACTCGC GCATTGCTGC TGTCACGGTG ACCGGAAGTG TTCGTGCGGG AGCGGCTATT 
GGCGCACAGG CTGGAGCGGC ACTGAAAAAA TGCGTACTGG AACTGGGCGG TTCGGATCCG 
TTTATTGTGC TTAACGATGC CGATCTGGAA CTGGCGGTGA AAGCGGCGGT AGCCGGACGT 
TATCAGAATA CCGGACAGGT ATGTGCAGCG GCAAAACGCT TTATTATCGA AGAGGGAATT 
GCTTCGGCAT TTACCGAACG TTTTGTGGCA GCTGCGGCAG CCTTGAAAAT GGGCGATCCC 
CGTGACGAAG AGAACGCTCT CGGACCAATG GCTCGTTTTG ATTTACGTGA TGAGCTGCAT 
CATCAGGTGG AGAAAACCCT GGCGCAGGGT GCGCGTTTGT TACTGGGCGG GGAAAAGATG 
GCTGGGGCAG GTAACTACTA TCCGCCAACG GTTCTGGCGA ATGTTACCCC AGAAATGACC 
GCGTTTCGGG AAGAAATGTT TGGCCCCGTT GCGGCAATCA CCATTGCGAA AGATGCAGAA 
CATGCACTGG AACTGGCTAA TGATAGTGAG TTCGGCCTTT CAGCGACCAT TTTTACCACT 
GACGAAACAC AGGCCAGACA TATGGCGGCA CGTCTGGAAT GCGGTGGGGT GTTTATCAAT 
GGTTATTGTG CCAGCGACGC GCGAGTGGCC TTTGGTGGCG TGAAAAAGAG TGGCTTTGGT 
CGTGAGCTTT CCCATTTCGG CTTACACGAA TTCTGTAATA TCCAGACGGT GTGGAAAGAC 
CGGATCTGA

Protein sequence

MTITPATHAI SINPATGEQL SVLPWAGADD IENALQLAAA GFRDWRETNI DYRAEKLRDI 
GKALRARSEE MAQMITREMG KPINQARAEV AKSANLCDWY AEHGPAMLKA EPTLVENQQA 
VIEYRPLGTI LAIMPWNFPL WQVMRGAVPI ILAGNGYLLK HAPNVMGCAQ LIAQVFKDAG 
IPQGVYGWLN ADNDGVSQMI KDSRIAAVTV TGSVRAGAAI GAQAGAALKK CVLELGGSDP 
FIVLNDADLE LAVKAAVAGR YQNTGQVCAA AKRFIIEEGI ASAFTERFVA AAAALKMGDP 
RDEENALGPM ARFDLRDELH HQVEKTLAQG ARLLLGGEKM AGAGNYYPPT VLANVTPEMT 
AFREEMFGPV AAITIAKDAE HALELANDSE FGLSATIFTT DETQARHMAA RLECGGVFIN 
GYCASDARVA FGGVKKSGFG RELSHFGLHE FCNIQTVWKD RI