Gene Sala_1124 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1124
Symbol
ID	4081484
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	1162461
End bp	1163462
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	67%
IMG OID	638009485
Product	fumarylacetoacetate (FAA) hydrolase
Protein accession	YP_616173
Protein GI	103486612
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.320291
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAACTGG CTTCGCTCAA GCACGGCCGT GATGGCCGCC TCGTCGTCGT TTCGGACGAT 
CTGGCTTGGT ATTCCGACGC ATCGGCGATC GCGCCGACGA TGCAGGCGGC GCTCGACGAC 
TGGGCCGATG CTGCGCCGCG TCTGGCCGCG CTGGCCGAGG ATTTGAACCA TGACGCGATC 
CCCAAGGAGC GCTTTCACGA GCGCGACGCC GCATCGCCAC TGCCACGCGC CTATCAATGG 
GCCGACGGCA GCGCCTATGT GAACCATGTC GCGCTGGTGC GCCAGGCGCG AGGCGCGGAA 
ATGCCCGAGA GTTTCTGGCA CGATCCGCTG ATGTACCAGG GCGGCAGCGA CGCTTTCCTT 
GCGCCGCGCG ACCCGATCCC GCTCGGCGAT CCGGCATGGG GGTGCGACAT GGAGGCCGAG 
ATCGTCGTCG TCACCGACGA TGTTCCCGCC GGGATCGATC CCGTCACGGC GCGCGAGAAG 
GTTCTGCTCG TCGGCCTGAC CAACGATGTC TCGCTCCGCG GACTGATCCC CGCCGAACTC 
GCCAAGGGGT TCGGCTTTTT CCAGTCCAAG CCGTCGAGTG CGATGTCGCC GGTTTTCGTG 
ACGCCCGACG CGCTGGGCGA CCAATGGAAG GATGGCAAGC TGCATGGCAC GCTGTGCGTT 
GACCTCAACG GTCAGCCGCT CGGCCGCGCC GATGCCGGCG TCGACATGAC CTTCGATTTC 
GGTCAGCTCA TCGCCCACGC GGCCAAAACG CGCAACCTTG GCGCGGGCAC GATCATCGGG 
TCAGGCACGG TGTCGAACCG TGACGCCGAC GGCGGCCCCG GCAAGCCGGT GAGCGAGGGC 
GGACTGGGGT ATAGCTGCCT TGCCGAAGTG CGGACGGTCG AAACGATCCG GCACGGCGAA 
GCGAAGACGC CCTTCATGCA GCGGGGCGAT ACGGTGCGTA TCTGGATGGA CGATGCGCGC 
CACCACAGCA TCTTCGGCGC GATTGAGCAG ACGGTCGCCT GA

Protein sequence

MKLASLKHGR DGRLVVVSDD LAWYSDASAI APTMQAALDD WADAAPRLAA LAEDLNHDAI 
PKERFHERDA ASPLPRAYQW ADGSAYVNHV ALVRQARGAE MPESFWHDPL MYQGGSDAFL 
APRDPIPLGD PAWGCDMEAE IVVVTDDVPA GIDPVTAREK VLLVGLTNDV SLRGLIPAEL 
AKGFGFFQSK PSSAMSPVFV TPDALGDQWK DGKLHGTLCV DLNGQPLGRA DAGVDMTFDF 
GQLIAHAAKT RNLGAGTIIG SGTVSNRDAD GGPGKPVSEG GLGYSCLAEV RTVETIRHGE 
AKTPFMQRGD TVRIWMDDAR HHSIFGAIEQ TVA