Gene Ent638_1457 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_1457
Symbol
ID	5114422
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	+
Start bp	1610450
End bp	1611460
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	47%
IMG OID	640491643
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_001176188
Protein GI	146311114
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0360083
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATTACC CCTTCGTTCG TAAAGCCCTT TTCCAGCTCG ATCCCGAGCG CGCTCATGAA 
TTGACATTCC AGCAGTTACG TCGCATCACA GGAACACCTT TGGAAGCGCT GGTGCGCCAG 
AAAGTGCAGG AAAAACCTGT TCAATGTATG GGGCTGACGT TTAAGAATCC CCTGGGTCTG 
GCTGCTGGCC TGGACAAGAA CGGCGAGTGT ATTGATGCGC TGGGCGCGAT GGGATTTGGT 
TCCATCGAAG TCGGCACGGT CACTCCACGT CCACAAGCGG GTAACGATAA ACCGCGACTG 
TTCCGTCTGG TTGAAGCCGA AGGGTTGATC AATCGAATGG GCTTTAATAA TCACGGCGTC 
GATCATCTGA TCGAGAACGT AAAAAAAGCG CATTTTGACG GCGTGCTGGG AATTAATATC 
GGCAAAAATA AAGACACGCC GGTAGAGCAG GGTAAAGATG ACTATCTGAT TTGTATGGAA 
AAAGTCTATG CTTATGCGGG TTATATTGCG GTGAATATCT CATCGCCAAA TACCCCTGGC 
TTGCGTACGC TGCAATATGG TGAAGCGCTG GACGATCTGT TATCAGCCAT TAAAAATAAA 
CAAAATGAAC TGCAGGAAAT TCACCATAAA TATGTTCCGG TCGCGGTAAA GATCGCTCCG 
GATCTTTCCG TTGAAGAATT GATCCAGGTT GCCGATAGTT TGGTTCGCCA TAATATTGAT 
GGTGTTATTG CGACCAATAC GACACTCGAT CGTTCGCTGG TAAATGGAAT GAAACATTGT 
GATGAAATGG GTGGGTTAAG CGGCCGTCCG GTACAATTAA AAAGCACCGA AATTATTCGC 
GCATTGTCCG CAGAATTAAA AGGGCGTTTA CCGATTATTG GCGTGGGTGG TATCGACTCT 
GTCATCGCTG CGCGTGAGAA GATGGCTGCG GGTGCGACGC TTGTACAAAT CTATTCTGGT 
TTTATTTTTA AAGGCCCTCA ATTGATTAAA GAAATCGTTA ATCATATCTA A

Protein sequence

MYYPFVRKAL FQLDPERAHE LTFQQLRRIT GTPLEALVRQ KVQEKPVQCM GLTFKNPLGL 
AAGLDKNGEC IDALGAMGFG SIEVGTVTPR PQAGNDKPRL FRLVEAEGLI NRMGFNNHGV 
DHLIENVKKA HFDGVLGINI GKNKDTPVEQ GKDDYLICME KVYAYAGYIA VNISSPNTPG 
LRTLQYGEAL DDLLSAIKNK QNELQEIHHK YVPVAVKIAP DLSVEELIQV ADSLVRHNID 
GVIATNTTLD RSLVNGMKHC DEMGGLSGRP VQLKSTEIIR ALSAELKGRL PIIGVGGIDS 
VIAAREKMAA GATLVQIYSG FIFKGPQLIK EIVNHI