Gene EcDH1_3101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3101
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	3330447
End bp	3331808
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	52%
IMG OID
Product	allantoinase
Protein accession	ACX40727
Protein GI	260450305
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTTTTG ATTTAATCAT TAAAAACGGC ACCGTTATTT TAGAAAACGA AGCTCGCGTT 
GTAGATATCG CCGTTAAAGG CGGAAAAATT GCTGCTATCG GTCAGGATCT GGGCGATGCA 
AAAGAAGTTA TGGATGCGTC TGGTCTGGTG GTTTCGCCGG GCATGGTTGA TGCGCACACC 
CATATTTCTG AACCGGGTCG TAGCCACTGG GAAGGTTATG AAACCGGTAC TCGCGCAGCG 
GCAAAAGGTG GTATCACCAC CATGATCGAA ATGCCGCTCA ACCAGCTGCC TGCAACGGTT 
GACCGCGCTT CAATTGAACT GAAGTTCGAT GCCGCTAAAG GCAAGCTGAC TATTGATGCG 
GCACAACTCG GTGGCCTGGT GTCTTACAAC ATCGACCGTC TGCATGAGCT GGATGAAGTG 
GGCGTTGTCG GCTTCAAATG CTTCGTTGCG ACCTGTGGCG ATCGCGGTAT CGACAACGAC 
TTCCGTGATG TAAACGACTG GCAGTTCTTC AAAGGTGCGC AGAAGCTGGG CGAACTGGGT 
CAGCCGGTGC TGGTGCACTG CGAAAACGCG CTGATTTGTG ACGAACTGGG CGAAGAAGCG 
AAGCGTGAAG GTCGCGTAAC CGCTCATGAC TATGTGGCTT CGCGTCCGGT ATTTACCGAA 
GTGGAAGCAA TTCGCCGCGT ACTGTATCTG GCGAAAGTTG CTGGTTGCCG TCTGCACGTT 
TGCCACGTCA GCAGCCCGGA AGGTGTTGAG GAAGTGACTC GTGCACGTCA GGAAGGTCAG 
GACGTTACTT GTGAATCCTG CCCGCATTAC TTTGTACTGG ATACCGATCA GTTCGAAGAA 
ATCGGTACTC TGGCGAAGTG TTCACCGCCG ATCCGCGATC TGGAAAACCA GAAAGGCATG 
TGGGAAAAAC TGTTTAACGG TGAAATCGAC TGCCTGGTTT CCGACCACTC TCCATGCCCG 
CCGGAAATGA AAGCCGGTAA CATCATGAAA GCATGGGGCG GTATCGCCGG TCTGCAAAGC 
TGCATGGACG TGATGTTCGA TGAAGCGGTA CAGAAACGCG GTATGTCTCT GCCAATGTTC 
GGCAAATTAA TGGCGACTAA CGCAGCAGAT ATTTTCGGTC TGCAGCAAAA AGGCCGTATC 
GCCCCAGGAA AAGATGCCGA CTTCGTCTTC ATTCAGCCGA ATAGCAGCTA TGTTCTTACC 
AATGACGATC TGGAATATCG CCACAAAGTC AGCCCGTATG TTGGCCGTAC CATTGGCGCG 
CGTATCACGA AAACCATCTT ACGTGGTGAT GTGATTTACG ACATTGAACA GGGCTTCCCT 
GTTGCGCCGA AAGGTCAATT TATCCTTAAA CATCAGCAGT AA

Protein sequence

MSFDLIIKNG TVILENEARV VDIAVKGGKI AAIGQDLGDA KEVMDASGLV VSPGMVDAHT 
HISEPGRSHW EGYETGTRAA AKGGITTMIE MPLNQLPATV DRASIELKFD AAKGKLTIDA 
AQLGGLVSYN IDRLHELDEV GVVGFKCFVA TCGDRGIDND FRDVNDWQFF KGAQKLGELG 
QPVLVHCENA LICDELGEEA KREGRVTAHD YVASRPVFTE VEAIRRVLYL AKVAGCRLHV 
CHVSSPEGVE EVTRARQEGQ DVTCESCPHY FVLDTDQFEE IGTLAKCSPP IRDLENQKGM 
WEKLFNGEID CLVSDHSPCP PEMKAGNIMK AWGGIAGLQS CMDVMFDEAV QKRGMSLPMF 
GKLMATNAAD IFGLQQKGRI APGKDADFVF IQPNSSYVLT NDDLEYRHKV SPYVGRTIGA 
RITKTILRGD VIYDIEQGFP VAPKGQFILK HQQ