Gene Jann_2039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_2039
Symbol
ID	3934492
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	+
Start bp	2044603
End bp	2045520
Gene Length	918 bp
Protein Length	305 aa
Translation table	11
GC content	61%
IMG OID	637904395
Product	fumarylacetoacetate (FAA) hydrolase
Protein accession	YP_509981
Protein GI	89054530
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.630421
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.541544
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATCG GTACGATCCA CTTTCAGGGC CGGGACAGGT TGGTGGCCCG CCTGGACGAT 
GACCAGGTTC TCGACCTGCT GGAGGCCTCA GGCGGCGACG TCCATTTCGT CAACACGGTC 
GCGATGATTG AAGCGGGACC CGCCGCATTG GACAAAGCGC GTGCGGTGCT GGAGGATCCC 
CCGACGCGCG CAGTGATCGC CCTGTCGCAG GCCGAGCACC GCGTGCCGCT GCGCCCCGTG 
CAGTATCGCG ATTGCCTTGT GTTTGAGCAG CATCTGATCA ACGGGTTCAA GCAGGCCGAG 
AAGATGACGG GGCGCCCCTT CGCCATTCCG CCGGTCTGGT ACGAGCAGCC GATCTACTAC 
AAGGGCAATC GGATGTCCTT CATTGGCCAC GGCCAGACGG TGCGATGGCC CGCCTACTCA 
GACTATCTGG ATCTGGAGCT GGAACTGGCG ATCATCATCG GGAAGGAGGG CGCTGATATC 
CCGCGCGAGA CGGCCCATGA GCATATCTGG GGCTATACCA TCCTTAATGA TGTTTCCGCC 
CGGGATGCGC AGATGCGGGA GATGGCGGGA CAGCTGGGGC CTGCAAAGGG CAAGGATTTT 
GATACAGGCA ATATCCTCGG GCCTTGGATC GTGACCGCCG ATGAAGTGTC GCATCCGGCC 
GTTTTGAACA TGGATGTGAG CGTGAACGGT GAGCGGTGGG GTGGTGGCAC GTCCGCCGAT 
ATGCAGTTCG ATTTCGCGCA GATCATCGCA CATATCTCCG CGTCTGAGCG GCTATTTCCC 
GGTGAAGTGA TCGGCTCCGG CACGGTCGGC ACTGGCTGTG GGCTGGAGAT CGGCAAGCGG 
CTCAGCGACG GCGATATGAT GGATTTGACG ATTGAGAAGA TCGGAACCCT GACCAACACA 
ATCAAGAAAG GGGCCTGA

Protein sequence

MKIGTIHFQG RDRLVARLDD DQVLDLLEAS GGDVHFVNTV AMIEAGPAAL DKARAVLEDP 
PTRAVIALSQ AEHRVPLRPV QYRDCLVFEQ HLINGFKQAE KMTGRPFAIP PVWYEQPIYY 
KGNRMSFIGH GQTVRWPAYS DYLDLELELA IIIGKEGADI PRETAHEHIW GYTILNDVSA 
RDAQMREMAG QLGPAKGKDF DTGNILGPWI VTADEVSHPA VLNMDVSVNG ERWGGGTSAD 
MQFDFAQIIA HISASERLFP GEVIGSGTVG TGCGLEIGKR LSDGDMMDLT IEKIGTLTNT 
IKKGA