Gene Sala_2021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_2021
Symbol
ID	4079958
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	2131015
End bp	2132301
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	64%
IMG OID	638010397
Product	cytochrome P450
Protein accession	YP_617065
Protein GI	103487504
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.00496503
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACAAAAC CTATATTGCC CGGAGAGGTC GCCGCCGCGG TCGTCAATCC CGCCGCCTAT 
GGGGCGTGGA AGCCGCTTCA TGAACAGCTT GCCTGGGCGC GGGCGAACAT GCCGCTGGCG 
GTTGCGGAGA ATCCGAACCA CGATCCTTTC TGGCTCGTCA CGCGCCATGC CGACGTCATG 
GCGATCAGCC GCGATCCGCA ACGCTTTGCC AACGGCATCC GGCCGACGGT GCTGACCGAC 
CGCGCGGGGG AGGCGCTGGC GCGCGCGGCG ACGCCGGGGG GCGATGGCCA TCTGGTTCGC 
TCGCTCGTCC AGATGGATGC GCCCGATCAT ATGAAATACC GACTGCTGAC GCAGAGCTGG 
TTCATGCCCA GGAATCTGAA GACGATCGAG GACCGGATTC GGCAGATCGC GCGCGACACC 
GTTGAGCACA TGCTGGAGGC AGGGGGATCA TGCGATTTCG CGCGCGATGT GGCGGCGCAT 
TATCCGCTGC GCGTCATCAT GGATATATTG GGCGTGCCGC CCGAGGACGA ACCGCGGATG 
CTGATGCTGA CGCAGCAATT GTTCGGACCG ACCGATCCCG AACTCAACCG CAGCCGTGAA 
GCAATCACCA GTTCCGAACA GGCGATCGCG ATGCTGCATT ATGTCATCGC GGACTTCGAG 
GCGTATTTCG GGGCGCTGAC CGCCGACCGC CGCGCCAACC CGCGCGAGGA TATTGCGACG 
GTGATCGCCA ATGCCATGGT CGATGGCGAG CAGATTCCCG ACCGCGAACT CGCCGGCTAT 
TATATGATCA TCGCGACCGC GGGCCACGAC ACGACGAGCG CGTCCACCGC CGGGGCGATC 
ATGGAACTGG CCCGCAATCC CACGCTGTTT CAGCGGTTTC GCGATGCGGA GAGCGACAAG 
GCGGGGCTGA TCGAGGAAGC GATCCGCTGG ACGACGCCGG TGCAGCATTT CATGCGCAGT 
GCCCGGCAAG ATGTCGAAAT GGGCGGGCAG ACGATCCGCG AAGGCGACTG GCTGATGCTG 
AATTATGTTT CCGCAAACCG CGACGAGGGG GTCTTTGTCG ATCCGTTCAT GTTCGATCCT 
GACCGCGCGA AGAACCCGCA GATCGCCTTT GGTTTCGGCG CGCATGTCTG CCTGGGGCAG 
CATCTGGCGC GGCTGGAGAT GCGGATTTTG ATGGAGGAGT TACTGCCGCG GCTGACCAGC 
CTGGAGCTGG CGGGCGAGCC CGCGCGCGTC GAATCGGTGT TCGTCGGCGG GCTGAAGCGG 
CTGCCGATCC GGTTTGAAGC GGCGTAG

Protein sequence

MTKPILPGEV AAAVVNPAAY GAWKPLHEQL AWARANMPLA VAENPNHDPF WLVTRHADVM 
AISRDPQRFA NGIRPTVLTD RAGEALARAA TPGGDGHLVR SLVQMDAPDH MKYRLLTQSW 
FMPRNLKTIE DRIRQIARDT VEHMLEAGGS CDFARDVAAH YPLRVIMDIL GVPPEDEPRM 
LMLTQQLFGP TDPELNRSRE AITSSEQAIA MLHYVIADFE AYFGALTADR RANPREDIAT 
VIANAMVDGE QIPDRELAGY YMIIATAGHD TTSASTAGAI MELARNPTLF QRFRDAESDK 
AGLIEEAIRW TTPVQHFMRS ARQDVEMGGQ TIREGDWLML NYVSANRDEG VFVDPFMFDP 
DRAKNPQIAF GFGAHVCLGQ HLARLEMRIL MEELLPRLTS LELAGEPARV ESVFVGGLKR 
LPIRFEAA