Gene Avin_50190 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_50190
Symbol	fahA
ID	7763870
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	5086938
End bp	5088272
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	72%
IMG OID	643807850
Product	fumarylacetoacetase
Protein accession	YP_002802084
Protein GI	226947011
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID	[TIGR01266] fumarylacetoacetase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATACCG CTCCGCTGCT CGACGCCACC CACAACCCGA CCCTGCAGAG CTGGGTCGCC 
TCGGCCAACG ACCCTGCCAC CGACTTCCCG ATCCAGAACC TGCCCTATGG CCGCTTCCGC 
CGCGCCGGCA GCGACGAGCC CTGGCGGATC GGCGTGGCCA TCGGCGACTG GATTCTCGAT 
CTGGCCCGCG CGGCCGCGGC CGGCGGCTGG AGCGACGAAG TGCGGACGGC GCTCGCCCCG 
CTCGCCGCCG GCGACCTCAA CGCCTTCATG GCCCTGGGCC CCGCGCTACG TCGCCGGGTG 
CGCGCCGCCC TGTCGACGGC GCTGAGCGCC GGCAGCCCGC GCCAGAACGA CCTCGCCGGC 
GCCCTGCTGC TCCAGGCCCA GGCGGAGTAC GACCTGCCGT GCCGGATTGG CGACTACACC 
GACTTTTACA CCGGCATCCA CCACGCGACC ACGGTGGGCA GCCTGTTCCG CCCGGACAAC 
CCGCTGCTGC CCAACTACAA GTGGATTCCC ATCGGCTACC ACGGCCGCAG CTCGTCGATC 
GGCGTCTCCG GCCAGACCTT CCAGCGTCCG CGCGGCCAGG TGAAGGCGCC CGACGCCGAG 
CGCCCCGAGT TCGTGCCCTG CCGCCGCCTC GACTACGAAC TGGAACTCGG CGCGCTGGTC 
GGCAGCGCCA ACGCCCTGGG CGAGCCGGTG CCGATGGATG CGGCCGAGGA CCACCTGTTC 
GGCGTCGTGC TGCTCAACGA CTGGTCGGCG CGCGACATCC AGGCCTGGGA ATACCAGCCG 
CTCGGTCCCT TCCTGGCCAA GAACTTCGCC ACCACGATTT CCCCCTGGGT GGTGACCATG 
GACGCCCTGG CCCCGTTCCG CGCCCCCTTC GCGCGACCGG CCGACGATCC GCAGCCGCTG 
CCCTACCTCG ACAGCGCCTT CAACCGCGAC TTCGGCGCCC TCGACCTGCG TTTCGAAGTG 
CTGCTGCAGA GCGCGGCGAT GCGCGAGCGC GGCGAGGCTC CGCACAGGCT CATGGAAAGC 
AACTTCCGCG ACGCCTACTG GACCCTGGCG CAGATGCTCG CCCACCACAC CGTGGGCGGC 
TGCAACCTGC AGCCGGGCGA CCTGCTCGGC AGCGGCACCC AGTCCGGCCC CGCGCCCGGC 
GAGGGCGGCT CGCTGCTGGA ACTGACCCTG GGCGGCAAGC AGCCGCTCGC CCTGCCCAAC 
GGCGAGACCC GCACCTTCCT GGAGGACGGC GACACGGTGA TCCTGCGCGG CCATTGCGAG 
CGCACGGGCG CCCGGCGCAT CGGCTTCGGC GACTGCGCCG GCAGCGTGCT GCCGGCCCGC 
GGGGTACGCC CATGA

Protein sequence

MNTAPLLDAT HNPTLQSWVA SANDPATDFP IQNLPYGRFR RAGSDEPWRI GVAIGDWILD 
LARAAAAGGW SDEVRTALAP LAAGDLNAFM ALGPALRRRV RAALSTALSA GSPRQNDLAG 
ALLLQAQAEY DLPCRIGDYT DFYTGIHHAT TVGSLFRPDN PLLPNYKWIP IGYHGRSSSI 
GVSGQTFQRP RGQVKAPDAE RPEFVPCRRL DYELELGALV GSANALGEPV PMDAAEDHLF 
GVVLLNDWSA RDIQAWEYQP LGPFLAKNFA TTISPWVVTM DALAPFRAPF ARPADDPQPL 
PYLDSAFNRD FGALDLRFEV LLQSAAMRER GEAPHRLMES NFRDAYWTLA QMLAHHTVGG 
CNLQPGDLLG SGTQSGPAPG EGGSLLELTL GGKQPLALPN GETRTFLEDG DTVILRGHCE 
RTGARRIGFG DCAGSVLPAR GVRP