Gene EcDH1_2202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_2202
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	2361476
End bp	2362900
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	53%
IMG OID
Product	1-pyrroline dehydrogenase
Protein accession	ACX39852
Protein GI	260449430
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.211355
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAACATA AGTTACTGAT TAACGGAGAA CTGGTTAGCG GCGAAGGGGA AAAACAGCCT 
GTCTATAATC CGGCAACGGG GGACGTTTTA CTGGAAATTG CCGAGGCATC CGCAGAGCAG 
GTCGATGCTG CTGTGCGCGC GGCAGATGCA GCATTTGCCG AATGGGGGCA AACCACGCCG 
AAAGTGCGTG CGGAATGTCT GCTGAAACTG GCTGATGTTA TCGAAGAAAA TGGTCAGGTT 
TTTGCCGAAC TGGAGTCCCG TAATTGTGGC AAACCGCTGC ATAGTGCGTT CAATGATGAA 
ATCCCGGCGA TTGTCGATGT TTTTCGCTTT TTCGCGGGTG CGGCGCGCTG TCTGAATGGT 
CTGGCGGCAG GTGAATATCT TGAAGGTCAT ACTTCGATGA TCCGTCGCGA TCCGTTGGGG 
GTCGTGGCTT CTATCGCACC GTGGAATTAT CCGCTGATGA TGGCCGCGTG GAAACTTGCT 
CCGGCGCTGG CGGCAGGGAA CTGCGTAGTG CTTAAACCAT CAGAAATTAC CCCGCTGACC 
GCGTTGAAGT TGGCAGAGCT GGCGAAAGAT ATCTTCCCGG CAGGCGTGAT TAACATACTG 
TTTGGCAGAG GCAAAACGGT GGGTGATCCG CTGACCGGTC ATCCCAAAGT GCGGATGGTG 
TCGCTGACGG GCTCTATCGC CACCGGCGAG CACATCATCA GCCATACCGC GTCGTCCATT 
AAGCGTACTC ATATGGAACT TGGTGGCAAA GCGCCAGTGA TTGTTTTTGA TGATGCGGAT 
ATTGAAGCAG TGGTCGAAGG TGTACGTACA TTTGGCTATT ACAATGCTGG ACAGGATTGT 
ACTGCGGCTT GTCGGATCTA CGCGCAAAAA GGCATTTACG ATACGCTGGT GGAAAAACTG 
GGTGCTGCGG TGGCAACGTT AAAATCTGGT GCGCCAGATG ACGAGTCTAC GGAGCTTGGA 
CCTTTAAGCT CGCTGGCGCA TCTCGAACGC GTCGGCAAGG CAGTAGAAGA GGCGAAAGCG 
ACAGGGCACA TCAAAGTGAT CACTGGCGGT GAAAAGCGCA AGGGTAATGG CTATTACTAT 
GCGCCGACGC TGCTGGCTGG CGCATTACAG GACGATGCCA TCGTGCAAAA AGAGGTATTT 
GGTCCAGTAG TGAGTGTTAC GCCCTTCGAC AACGAAGAAC AGGTGGTGAA CTGGGCGAAT 
GACAGCCAGT ACGGACTTGC ATCTTCGGTA TGGACGAAAG ATGTGGGCAG GGCGCATCGC 
GTCAGCGCAC GGCTGCAATA TGGTTGTACC TGGGTCAATA CCCATTTCAT GCTGGTAAGT 
GAAATGCCGC ACGGTGGGCA GAAACTTTCT GGTTACGGCA AGGATATGTC ACTTTATGGG 
CTGGAGGATT ACACCGTCGT CCGCCACGTC ATGGTTAAAC ATTAA

Protein sequence

MQHKLLINGE LVSGEGEKQP VYNPATGDVL LEIAEASAEQ VDAAVRAADA AFAEWGQTTP 
KVRAECLLKL ADVIEENGQV FAELESRNCG KPLHSAFNDE IPAIVDVFRF FAGAARCLNG 
LAAGEYLEGH TSMIRRDPLG VVASIAPWNY PLMMAAWKLA PALAAGNCVV LKPSEITPLT 
ALKLAELAKD IFPAGVINIL FGRGKTVGDP LTGHPKVRMV SLTGSIATGE HIISHTASSI 
KRTHMELGGK APVIVFDDAD IEAVVEGVRT FGYYNAGQDC TAACRIYAQK GIYDTLVEKL 
GAAVATLKSG APDDESTELG PLSSLAHLER VGKAVEEAKA TGHIKVITGG EKRKGNGYYY 
APTLLAGALQ DDAIVQKEVF GPVVSVTPFD NEEQVVNWAN DSQYGLASSV WTKDVGRAHR 
VSARLQYGCT WVNTHFMLVS EMPHGGQKLS GYGKDMSLYG LEDYTVVRHV MVKH