Gene Veis_4149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_4149
Symbol
ID	4691505
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	-
Start bp	4564906
End bp	4566357
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	68%
IMG OID	639851896
Product	phenylhydantoinase
Protein accession	YP_998872
Protein GI	121611065
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR02033] D-hydantoinase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.435965
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCAAG CCCTTGTGAT TCGCGGCGGC ACCGTGGTCA ACGCCGACCG GGAACAAACT 
GCCGATCTGC TGTGCGTCGA TGGCCGCATC GTGGCGCTGG GCGCCGATGC GGCGGCGCAG 
GCGCCCGCCG GCGCGCAGAC CCTCGATGCC AGCGGCCAGT ACATCCTGCC CGGCGGCATC 
GACCCCCACA CCCACATGCA ACTGCCGTTC ATGGGCACCG TGACCGCAGA CGACTTTTTC 
ACCGGCACGG CAGCCGGCCT GGCCGGCGGC ACGACCAGCA TCATCGACTT CGTCATCCCC 
GATCCGCAGG AGCCGCCCAT GGCCGCCTAC CGCAAGTGGC GCGGCTGGGC CGAAAAGTCT 
GCGGCCGACT ACGGCTTTCA TGTGGCCATC ACCTGGTGGA GCGAGCAGGT GCACGCCGAC 
ATGGGCCAAC TGGTGCAAGA AGAAGGCGTG AACAGCTTCA AGCACTTCAT GGCCTACAAG 
AACGCCATCA TGTGCGACGA CGAAACGCTG GTAAACAGCT TCCAGCGCGC GCTGGAACTG 
GGCGCCATGC CCACGGTGCA TGCCGAAAAC GGCGAACTGG TCTACCGGCT ACAGCAGGAC 
GTGGCCAAAA AAGGCATCAC CGGCCCCGAA GGCCATCCGC TGGCCCGCCC GCCGCTGGTC 
GAGGCCGAGG CCGCCCAGCG CGCCATCGCC ATTGCCGAGG TGCTCGGAGT GCCGATCTAT 
GTGGTGCATG TCAGTTGCCA GGAAGCCGCC GACGCGATAG CCCGCGCCCG CGCGCGCGGC 
CAGCGCGTGT ACGGCGAAGT GCTGGCCGGG CACCTGCTGA TCGACGACAG CGTGTACCGC 
GACCCGGACT TCGCCCGGGC CGCAGCGCAT GTGATGAGCC CGCCGTTTCG CCCCAAAGCC 
CACCAGGAGG CGCTCTGGCG CGGCCTGCAA TCGGGCCAGT TGCAAACCAC GGCCACCGAC 
CACTGCGTGT TTTGCGCCGC GCAAAAAGCC ATGGGCCAAA AGAACTTCGC CCACATCCCC 
AATGGCACCG GCGGCGTGGA AGAGCGCATG GCCGTCATCT GGGACGCCGG CGTGAATAGC 
GGGCGCCTGA CGCCCAGCGA ATTCGTGGCC ATCACCTCGG CCAACGCGGC CCGCCTGTTC 
AACATCTACC CGCGCAAAGG CTTCATCGGC GCCGGCGCCG ACGCCGACCT GGTGCTGTGG 
GACCCCGAGG GCACGAAAAC CATCTCGGCC AAGACCCAGC ACAGCAAGGG CGACTTCAAC 
ATCTTTGAAG GCCGCAGCGT GCGCGGCATC GCCGCCCATA CCGTGAGCCA GGGCCGCGTG 
GTCTACGCCA ACGGCGAACT ACGCGCCGAG CCAGGCCGGG GCCGCTACAT CGCGCGCCCG 
GCGTTTGGCG CCAACTTCCA GGCCCTGCAA AAACGCGCCC GGCATTTGGC CCCGGCCGCC 
GTGGCCCGCT GA

Protein sequence

MNQALVIRGG TVVNADREQT ADLLCVDGRI VALGADAAAQ APAGAQTLDA SGQYILPGGI 
DPHTHMQLPF MGTVTADDFF TGTAAGLAGG TTSIIDFVIP DPQEPPMAAY RKWRGWAEKS 
AADYGFHVAI TWWSEQVHAD MGQLVQEEGV NSFKHFMAYK NAIMCDDETL VNSFQRALEL 
GAMPTVHAEN GELVYRLQQD VAKKGITGPE GHPLARPPLV EAEAAQRAIA IAEVLGVPIY 
VVHVSCQEAA DAIARARARG QRVYGEVLAG HLLIDDSVYR DPDFARAAAH VMSPPFRPKA 
HQEALWRGLQ SGQLQTTATD HCVFCAAQKA MGQKNFAHIP NGTGGVEERM AVIWDAGVNS 
GRLTPSEFVA ITSANAARLF NIYPRKGFIG AGADADLVLW DPEGTKTISA KTQHSKGDFN 
IFEGRSVRGI AAHTVSQGRV VYANGELRAE PGRGRYIARP AFGANFQALQ KRARHLAPAA 
VAR