Gene Sala_2246 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_2246
Symbol
ID	4080260
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	2358444
End bp	2359484
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	70%
IMG OID	638010624
Product	hypothetical protein
Protein accession	YP_617288
Protein GI	103487727
COG category	[R] General function prediction only
COG ID	[COG3173] Predicted aminoglycoside phosphotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGTTTTC CGACCGCGCC CGGCGCGATG ACGCCCGACT GGCTCGGCGC GGTGCTGGGG 
CATCCCGGCC AGCTCCGGGG CTTTACCGCG GCCAAGGTCG GCACGGGGCA GATGTGCGAC 
AGCTTCCGCC TGACGCTCGA CTGGGCGGAC GATGTGCGCG GCCCGACGAG CGTAATCGCC 
AAATGTCCGA GCCACGACGA AGCGAGCCGC CATATCGCGC GGCTGACCGG CACCTATGTC 
AAGGAAGTCA GCTGGTATCG CGAACTCGCG GCGGACAGCG GTGTCGCGGC GCCGCAGTGC 
CATCATGCCG AAATTGCGGG CGATGGTGTC GATTTCATCC TCATCCTCGC CGATCTCGCG 
CCCGCCCGGC AGGGCGATCA GCTCGCGGGT ATCGACGCCG CCTGGCTCGT CCCCTGCATC 
GACGCGGCGG CGGCGCTGCA CGCCCTGCTC TGGAACGACC CGCGGCTGGG CACGCTGCCC 
TGGCTCGCGC GCGACAATGG CGATGTGGTG CGCGCGCTGT TCCCGCAGCT CTATGCCGGG 
TTTCGCGAAC GCTATGCGGC GCGGCTCGCG TCCGAGGTGC TGGACCTCGG CGCCGGAATC 
GTCCAGCGGC TCGACTGCTA TCTCGCGCGC GAACCCGCCG CGCGCACGAT CGTCCACGGC 
GACCTGCGCA TCGACAATAT CCTGTTCGCG CCGGACGGCC AGGCCTGCTG GCTCGTCGAC 
TGGCAGACGC TGGGGCGCGG CAGCGGCGCC GCCGACCTGG CCTATCTCGT CGGCACCAGC 
ATCGCCGATC CGGCCGAGCG CGCCGCCGCC GACCGGCCGG CGTTCGACCA GTGGATCGCC 
GCGCTTCGGG CGCGCGGCAT AGCGCCCGAT CCTGATGCGT TATGGACCGA TTATCGCGTC 
GGCGCGCTCA GCGGCTATTT CATGGCGGTC TTCGCCTCGA TGAGCGTCGA GCGCACGCCG 
CGCGGCGACG AAATGTTCGC GCTGATGGCC GAACGCCCCG CGCGCCAGGC GCTCGACCTC 
GGCAGTCTCG ACCTGCTTTA G

Protein sequence

MSFPTAPGAM TPDWLGAVLG HPGQLRGFTA AKVGTGQMCD SFRLTLDWAD DVRGPTSVIA 
KCPSHDEASR HIARLTGTYV KEVSWYRELA ADSGVAAPQC HHAEIAGDGV DFILILADLA 
PARQGDQLAG IDAAWLVPCI DAAAALHALL WNDPRLGTLP WLARDNGDVV RALFPQLYAG 
FRERYAARLA SEVLDLGAGI VQRLDCYLAR EPAARTIVHG DLRIDNILFA PDGQACWLVD 
WQTLGRGSGA ADLAYLVGTS IADPAERAAA DRPAFDQWIA ALRARGIAPD PDALWTDYRV 
GALSGYFMAV FASMSVERTP RGDEMFALMA ERPARQALDL GSLDLL