Gene Sala_3165 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_3165
Symbol
ID	4082501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	3314648
End bp	3315829
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	64%
IMG OID	638011550
Product	Rieske (2Fe-2S) region
Protein accession	YP_618201
Protein GI	103488640
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATGC TGCGCGAAAC CTTCGACAAC ATCGACCCGC TCGATGGCTG GTCGCTCCCG 
GCGTGGACCT ACAGCGACCC CGATTTCTAC GCCGTCGAAA TGGCGCGCAT CTTCCGCCCC 
AGCTGGCAGG TCGTCTGCCA TGACAGCGAC ATCGCGAACC CCGGCGACTG GCACAGCATC 
GACTATTGCG GCGAAAGCAT CATCCTTGTG CGCGGAACCG ACCGCATCGT GCGCGCCTTC 
ACCAACGTCT GCCGCCACCG CGGCTCGCGC CTCGTCGATG GTGCCGCGGG CTGTGCCAAA 
AAGCTCGTCT GCCCCTATCA CGCCTGGACC TATGAACTCG ACGGCCGACT GACGGGCGTT 
CCTGATTCGG CGAGCTATCC GACGCTCGAC AAGGGCAGGG CGGGGCTCGT CGGCGTCGAG 
GCCGAACAAT GGCGCGGCTT CTGGTTCGTC CGGCTCGATG ATGACGGCGG GCCGTCGGTC 
GCCGACATGA TGGCGCCCTA TGAGACGACG GTTGAGCCGT ATCGTTTCGA GGAACTCGGC 
GCGCTCGGCC GCGTCACGCT TCGCCCGCGC GCGGTCAACT GGAAAAATGT CGGCGACAAT 
TATTCGGACG GCCTTCACAT CCCCGTCGCG CATCCGGGCC TGACCCGGCT TTTTGGCAAA 
AGCTATGGCG TCGAGGCCAG GGAGCGCGTC GATCGCATGT GGGGCGACCT CGTCGACCGG 
CCGTCGGCGA ACTGGTCCGA ACGTCTGTAC CAGCGGCTGT TGCCGCCGAT TCCGCACCTG 
CCCGCCGACC GCCAGCGCCA CTGGCTCTAT TTCAAGCTGT GGCCCAATGT CGCCTTCGAC 
ATCTATCCCG ACCAGGTCGA TTTCATGCAG TGGCTGCCGA CCGGTCCGAC GAGCTGTCTG 
ATCCGCGAAA TCTCCTATGT GCTGCCCGAC GCCTATACTG GAGAGTGGCG CCACGAAATG 
CGCGCCGCGC GCTACCTCAA CTGGCGCATC AACCGTCAGG TCAATGCCGA GGACACGGCG 
CTCATCACGC GCGTCCAGCA GGGCATGCAA TCGCAGAGCT TCTCGATGGG ACCGCTCAGC 
GACAAGGAAG TCTGCCTCAA ACATTTCTGC GCGCGGATGC GCGCCATCAT TCCCGAAGCG 
CGGCTCGAGC ACGCGCCTGC CGCCGGTTGG AGCAATAAAT GA

Protein sequence

MAMLRETFDN IDPLDGWSLP AWTYSDPDFY AVEMARIFRP SWQVVCHDSD IANPGDWHSI 
DYCGESIILV RGTDRIVRAF TNVCRHRGSR LVDGAAGCAK KLVCPYHAWT YELDGRLTGV 
PDSASYPTLD KGRAGLVGVE AEQWRGFWFV RLDDDGGPSV ADMMAPYETT VEPYRFEELG 
ALGRVTLRPR AVNWKNVGDN YSDGLHIPVA HPGLTRLFGK SYGVEARERV DRMWGDLVDR 
PSANWSERLY QRLLPPIPHL PADRQRHWLY FKLWPNVAFD IYPDQVDFMQ WLPTGPTSCL 
IREISYVLPD AYTGEWRHEM RAARYLNWRI NRQVNAEDTA LITRVQQGMQ SQSFSMGPLS 
DKEVCLKHFC ARMRAIIPEA RLEHAPAAGW SNK