Gene Vapar_4783 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Vapar_4783
Symbol
ID	7970253
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Variovorax paradoxus S110
Kingdom	Bacteria
Replicon accession	NC_012791
Strand	-
Start bp	5095332
End bp	5096402
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	68%
IMG OID	644795378
Product	fumarylacetoacetate (FAA) hydrolase
Protein accession	YP_002946654
Protein GI	239817744
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.155683
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACTCG CCACCCTGAA GGACGGCTCG CGCGACGGCC AGCTCGTCGT CGTCTCGCGC 
GACCTCACGC TCGCCCACTA CGCCACTGGC ATCGCCAGCC GGCTGCAGCA GGTGCTGGAC 
GACTGGGGCT TCATGAGCCC GCAGCTGCAG GACCTGTACG ACGCGGTCAA CACCGGCCGC 
GCACGCCATT CCTTCCCGTT CGACCCCGCC CAGTGCATGG CGCCGCTGCC GCGCGCCTAC 
CAGTGGGCCG ACGGCTCGGC CTACCTGAAT CACGTCGAGC TGGTGCGCAA GGCGCGCAAT 
GCCGAAGTGC CCGAGAGCTT CTACCAGGAC CCGCTGATGT ACCAGGGCGG CAGCGACGAC 
TTCCTCGGCC CGACAGACGA CGTGGTCGTG CCCAGCGAAG CCATGGGCAT CGACTTCGAG 
GCCGAGATCG CGGTGATCAC CGGCGACGTG AAGATGGGCG CCACGCCCGA CCAGGCGCTC 
GACGGCATCC GCCTGGTGAT GCTGGCCAAC GACGTGAGCC TGCGCAACCT GATCCCTGCC 
GAGCTGGCCA AGGGCTTCGG CTTCTTCCAG AGCAAGCCGG CCACCGCCTT CAGCCCCGTG 
GCCGTGACGC TCGACGAGAT CGGCGAAGCC TGGCAGCACG GCCGCGTGCA CCTCACGCTG 
CAAAGCAGCT GGAACGGCCG CAAGGTCGGC ATGTGCGACG CCGGGCCCGA GATGACCTTC 
CATTTCGGCC AGCTCATCGC CCACATCGCC AAGACGCGCA ACGTGCGCGC CGGCAGCATC 
GTCGGCAGCG GCACCGTGAG CAACAAGGGC GTGGAAAAGA GCGGCCAGAT GGACTGGCCC 
AAGGGCTATT CGTGCATTGC CGAGAAGCGC TGCATCGAAA CCATCCAGGG CGGCGAGCCC 
GTGACCGAAT TCATGAAGTT CGGCGACACC ATCCGCATCG AGATGAAGGG GCTCGATGGC 
CGCTCGCTGT TCGGCGCGAT CGACCAGGAA ATCGTGTCGG CGGCGGGGCG GGCGAAGGTG 
GCGCCGGTGT CGCTGGCGAA CCCGCAGGAC GACGACGGCG CCGAAGGCTG A

Protein sequence

MKLATLKDGS RDGQLVVVSR DLTLAHYATG IASRLQQVLD DWGFMSPQLQ DLYDAVNTGR 
ARHSFPFDPA QCMAPLPRAY QWADGSAYLN HVELVRKARN AEVPESFYQD PLMYQGGSDD 
FLGPTDDVVV PSEAMGIDFE AEIAVITGDV KMGATPDQAL DGIRLVMLAN DVSLRNLIPA 
ELAKGFGFFQ SKPATAFSPV AVTLDEIGEA WQHGRVHLTL QSSWNGRKVG MCDAGPEMTF 
HFGQLIAHIA KTRNVRAGSI VGSGTVSNKG VEKSGQMDWP KGYSCIAEKR CIETIQGGEP 
VTEFMKFGDT IRIEMKGLDG RSLFGAIDQE IVSAAGRAKV APVSLANPQD DDGAEG