Gene Veis_2137 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_2137
Symbol
ID	4691119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	-
Start bp	2428180
End bp	2429313
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	65%
IMG OID	639849899
Product	4-hydroxyphenylpyruvate dioxygenase
Protein accession	YP_996903
Protein GI	121609096
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG3185] 4-hydroxyphenylpyruvate dioxygenase and related hemolysins
TIGRFAM ID	[TIGR01263] 4-hydroxyphenylpyruvate dioxygenase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.658248
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCAG CATTGCCGCA ACCAGCAGCC ACGCCCGTCG GCGCCGGCTG GGACAATCCC 
ATGGGCACCG ATGGTTTCGA ATTCATCGAA TTCGCCGCAC CCGACCCGCA GGCCATGGGC 
CGGGTGTTTG TCAGCCTGGG TTTCAGACCC GTGGCGCGCC ATCGCCACAA GGCCGTCACG 
CTGTACCGCC AGGGCCAGAT CAACTTCATC ATCAACGCCG AGCCCGACAG CTTTGCCCAG 
CGCTTTGCAC GCCAGCACGG CCCCAGTGTC TGCGCCATCG CGTTGCGCGT GCACGATGCC 
AAGGCCGCTT ACGGGCGCGC GCTGGACCTG GGCGCCTGGG GCTATGCGGG CACGGCCGGC 
CCGGGCGAGT TGAACATCCC GGCGCTCAAG GGCCTGGGCG ACAGCCTGAT CTACCTGGTC 
GATCGCTGGC GCGGCAAGAA CGGCGCCCAG CCCGGCGACA TCGGCGACAT CGCCTTTTTC 
GACGTCGACT TCGAGCCCCT GCCCGGCATC AGCGCCGCCG AAGCCCTGAA CCCCAGGGGC 
CATGGCCTGA GCTATATCGA CCACCTGACG CACAACGTGC ACCGGGGCCG GATGAACGAA 
TGGGCCGACT TCTACCAGCG GCTGTTCAAC TTCCGCGAAC TGCGCTACTT CGACATCGAA 
GGCCAGCTCA CCGGCGTCAA GAGCCGGGCC ATGACCAGCC CCTGCGGCAA GATCCGCATC 
CCGATCAATG AAGAGGGCCG GGAAAGAGCC GGCCAGATCC AGGAATATCT GGACAGGTAC 
AAGGGCGAAG GCATACAGCA CATCGCCATG GGCGCCGACA ACCTCTACCA CAGCGTAGAC 
GCGCTGCGCC GCAGCGGCGT GCGCCTGCTC GACACGCTGG ACACTTACTA CGAGTTGGTG 
GAGCAACGCA TCCCGGGCCA TGGCGAGCCG CTGCAAGCCC TCAAGGAGCG CAAGATCCTG 
ATCGACGGCA GCGCCGGCAA ACTGCTGCTG CAAATCTTCA GCGAAAACCT GCTCGGCCCG 
ATCTTCTTCG AGTTCATACA GCGCAAGGGC GACGACGGCT TTGGCAACGG CAACTTCAAA 
GCGCTGTTCG AGAGCATGGA ACTCGACCAG ATGCGCCGTG GCGTGCTCGG CTAG

Protein sequence

MNAALPQPAA TPVGAGWDNP MGTDGFEFIE FAAPDPQAMG RVFVSLGFRP VARHRHKAVT 
LYRQGQINFI INAEPDSFAQ RFARQHGPSV CAIALRVHDA KAAYGRALDL GAWGYAGTAG 
PGELNIPALK GLGDSLIYLV DRWRGKNGAQ PGDIGDIAFF DVDFEPLPGI SAAEALNPRG 
HGLSYIDHLT HNVHRGRMNE WADFYQRLFN FRELRYFDIE GQLTGVKSRA MTSPCGKIRI 
PINEEGRERA GQIQEYLDRY KGEGIQHIAM GADNLYHSVD ALRRSGVRLL DTLDTYYELV 
EQRIPGHGEP LQALKERKIL IDGSAGKLLL QIFSENLLGP IFFEFIQRKG DDGFGNGNFK 
ALFESMELDQ MRRGVLG