Gene Sala_1387 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1387
Symbol
ID	4081859
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	1442455
End bp	1443594
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	65%
IMG OID	638009753
Product	cupin 2, barrel
Protein accession	YP_616434
Protein GI	103486873
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3435] Gentisate 1,2-dioxygenase
TIGRFAM ID	[TIGR02272] gentisate 1,2-dioxygenase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.125216
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGGCC CTTCGACGAT CATCGATCCG CGCGACGACG TGCTCGGCCG GTCGCGCGTC 
ACCGACACGC CCGAGCTGGA GGCGTTTTAC GAAGAGCTCG CGGCGCGCAA CGCCGGCGCC 
TTCTGGAAGC GCGCCAATGC GATCGAACCA TGGGAGCCCG CCACGCGCTA TCGCCCGACG 
CTCTGGCGTT ATGCCGAGAT GCGCGCCATG TGCCTGCGCG CGCTTGATCT CGTAAGGCCC 
GACGAAGCGG GGCGGCGCGT CGTCACCCTG CTCAACGACA GCGATGCGGG GCGCGAGAAT 
GTCGCGGTGT GCGGCTGGCT GTTCAGCGGA ATGCAGGCGA TGCGCCCCGG CGAGATCACC 
CCCGCGCACA AACACACGGC GTCGGCGCAC CGTTTCATCA TGGAGGGGAA GGGCGCCTAT 
ACCGTTGTCG ACGGGCATCA CATCACGCTG GGTGCCAACG ACTATGTGCT GACCCCGAAC 
GGCTGCTGGC ACGACCATGG CGTCGCCGCC GACGGCGAAG TGTCGATCTG GCAGGACGGG 
CTCGACATCC CGCTGATGAA CAGCCTCGAA ACCAATTTCT ATGCCGTCTA CGACCAGCCC 
GCGCAGACGG CAGCCTATCC GGCGGACGAT CTGCCGCTGA CCTATGGCGG CGCGGCGCTC 
CGCCCCGAAG GCGTCGCGGC CTGGGAAAAA CCCTATTCGC CGGTGATGGT CTATCGCTGG 
GAGGCCGTGC GCGATGCCTT GTTGAACCTT GCGAAAGTGT CGGTCGGGTC GCCCTTCGAC 
GGTCATATGA TGCGCTATGC CAACCCGCTG ACCGGCGGCT GGGCGCTCCA GACGATGGGC 
GCGCATATGC GGATGCTGCC CGGCGGTTTT CGCGGCAAGG CGCACCGCCA CACGGGCAAT 
GTCGTCTATA ATGTCGCGCG CGGCCGCGGC TGTTCGATCA TCGGCGGTCA GCGGTACGAC 
TGGCAGACAC ACGATATTTT CTGTGTGCCC GCGTGGACCT GGCACGAGCA TGTCAATCTC 
GATGCCGCGG AAGAAGCCTT CCTCTTCTCG TTCAACGACT TCCCCGTGAT GGAGGCGCTC 
GGCGTCCGGA TCGAGGAACC TTTCCCGAAA AACGACGGAC ATCAAATATG CGCTTCGTAA

Protein sequence

MTGPSTIIDP RDDVLGRSRV TDTPELEAFY EELAARNAGA FWKRANAIEP WEPATRYRPT 
LWRYAEMRAM CLRALDLVRP DEAGRRVVTL LNDSDAGREN VAVCGWLFSG MQAMRPGEIT 
PAHKHTASAH RFIMEGKGAY TVVDGHHITL GANDYVLTPN GCWHDHGVAA DGEVSIWQDG 
LDIPLMNSLE TNFYAVYDQP AQTAAYPADD LPLTYGGAAL RPEGVAAWEK PYSPVMVYRW 
EAVRDALLNL AKVSVGSPFD GHMMRYANPL TGGWALQTMG AHMRMLPGGF RGKAHRHTGN 
VVYNVARGRG CSIIGGQRYD WQTHDIFCVP AWTWHEHVNL DAAEEAFLFS FNDFPVMEAL 
GVRIEEPFPK NDGHQICAS