Gene Sala_1386 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1386
Symbol
ID	4081858
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	1441559
End bp	1442467
Gene Length	909 bp
Protein Length	302 aa
Translation table	11
GC content	63%
IMG OID	638009752
Product	5-oxopent-3-ene-1,2,5-tricarboxylate decarboxylase
Protein accession	YP_616433
Protein GI	103486872
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.221337
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCTTCG TAACATATCG CACGGTCGAA ACCGAACCGC GGCTGGGCCT TCTCCACGAC 
GGCCTTGTGA TCGATGTCGA TTATTTCGGC GATGCGATCG GGCAGGATTT GCCATCGACG 
ATGCTCGATT TCATCGACCT GGGACCGATC GGCCCGCGCT TCCTGCGCGA AGCGGTCGAA 
AGCGCGACGC CCGCCGACCT GCTCGGCACT TCGCTGCCCC AGGGCAATGT CACCTTGCTC 
GCGCCGATCC CGCGCCCGCG CAAGAATATC TTCGGCATCG GGCTTAACTA TACCGAGCAT 
GTCGCCGAAT CCGCCCGCGC GCTCGATACC GCGCACGAAC TGCCGCAGCA GCCGGTGATC 
TTCTCGAAGC CGCCCACGGC CGTCGCCGCG TGGAACGACC CGATCCGTCA CAATGCGAAA 
GTGACACAGC AACTCGACTG GGAAACTGAA TTGGCGGTGA TCATCGGCAG TACCGCGCGC 
GGCGTGGCCG AGGCCGACGC GCTGAACCAC GTGTTCGGCT ATACCGTCAT CAACGATGTG 
TCGGCGCGTG ACTGCCGCCG CGCCGGGCAA TGGATCGTCT CGAAAGGGCA GGACAGCTTT 
GCCCCCATGG GGCCATGCAT CGTCACCGCC GACGAGATCG GCGACCCGCA TAATCTCAAT 
ATCCTCACCC ATGTGAACGG AGTGGAAAAG CAGAACAGCA ACACGCGCTT CATGCTGTTC 
AACGTGCCCC AGCTGATCGC TGACATTGCC CGTGTGATGA CGCTCGAACC CGGCGACATC 
ATCGCGACCG GAACGCCCGC CGGGGTCGGC GCGGGGCGCG ATCCGCAGGA GTTTCTGTGG 
CCCGGCGATG TCGTCGAATG CACCGTCGAA GGCATCGGCA CACTCCGCAA CCCGGTTGTC 
GCGGTCTGA

Protein sequence

MRFVTYRTVE TEPRLGLLHD GLVIDVDYFG DAIGQDLPST MLDFIDLGPI GPRFLREAVE 
SATPADLLGT SLPQGNVTLL APIPRPRKNI FGIGLNYTEH VAESARALDT AHELPQQPVI 
FSKPPTAVAA WNDPIRHNAK VTQQLDWETE LAVIIGSTAR GVAEADALNH VFGYTVINDV 
SARDCRRAGQ WIVSKGQDSF APMGPCIVTA DEIGDPHNLN ILTHVNGVEK QNSNTRFMLF 
NVPQLIADIA RVMTLEPGDI IATGTPAGVG AGRDPQEFLW PGDVVECTVE GIGTLRNPVV 
AV