Gene Sala_0756 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_0756
Symbol
ID	4081166
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	764045
End bp	765175
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	67%
IMG OID	638009114
Product	DNA polymerase IV
Protein accession	YP_615809
Protein GI	103486248
COG category	[L] Replication, recombination and repair
COG ID	[COG0389] Nucleotidyltransferase/DNA polymerase involved in DNA repair
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACGACA GCGACGATCA TGGCCTCGAC GACGGCGCGG ACCCGCCCCC GGTCCGCAAG 
ATCATCCACG TCGACATGGA CGCCTTTTAC GCTTCGGTCG AACAGCGCGA CGATCCCGCG 
CTCCGCGGCA AGCCGGTTGC GGTCGGCGGA TCGTCGCGGC GCGGCGTCGT TGCGGCCGCC 
TCCTATGAGG CGCGGCGGTT CGGCGTACGC TCGGCAATGC CCAGCATTAC CGCGAAGCGC 
CAGTGCCCCG GCCTCATCTT CGTGCCGCCG CGTTTCGAGG TTTACCGCGA GGTGTCGCAT 
CAGATCCGCG CGATTTTCCG CGATTATGCC GACGAGGTCG AGCCGCTGTC GCTCGACGAG 
GCCTATCTCG ACGTCAGCGC CGACAAGGCG GGACTCGGCA GCGCGACCGC GACCGCGCGG 
CTGATCCGCC GCCGCATCCG CGAAGAAACC GGGCTCACCG CCTCGGCCGG GGTATCCTAT 
AACAAGTTCA TCGCCAAGCT GGCGTCGGAC CAGAACAAGC CGGACGGCCT CACCGTCATC 
CCGCCGGGCA AGGGCGCCGC CTTTGTCCAG ACGCTGTCGA TCCGTCGTTT CCACGGCATC 
GGCCCTGTTA CCGCGGCAAA AATGGAGGGG CTCGGCGTCT TTTCGGGCGC CGACCTAGCC 
GCGAAAGATC CGTTGTGGCT CGCCGAGCAT TTCGCCAACA GCGCCGAATG GCTCTATAAC 
CTTGCCCGCG GGATCGACCA TCGCCGCGTC AAGTCGAACC GGCCGCTCAA ATCCTTGGGC 
GGCGAGCGCA CCTTCTTCAA CGACCTGATC ACCGATACCG AAATCCGCGA GGCGCTGGCG 
CATGTCTGCA CCGTGGTATG GGACCGCGCG GTGAAAAAGG GCGCACGCGG GCGCACGGTG 
ACGCTGAAGT TGCGCTACGC CGATTTCCGC ACGATCACGC GCGCGAAGTC GGTGCCTTCG 
CCGATCCGCG ATGGCGCCAG CCTGCTCGCG GTGGGCGAGG CAATCCTGGC TCCCCTGCTG 
CCCAGCGAAC AGGGCATCCG CCTGCTCGGT GTCACGCTGA GCAAGTTCGA GGGCGAAGAG 
GAGGAGGGGG ACGAAGCCCC CGCCCCCGCC GACCTGCTCA GCCTTATTTA G

Protein sequence

MDDSDDHGLD DGADPPPVRK IIHVDMDAFY ASVEQRDDPA LRGKPVAVGG SSRRGVVAAA 
SYEARRFGVR SAMPSITAKR QCPGLIFVPP RFEVYREVSH QIRAIFRDYA DEVEPLSLDE 
AYLDVSADKA GLGSATATAR LIRRRIREET GLTASAGVSY NKFIAKLASD QNKPDGLTVI 
PPGKGAAFVQ TLSIRRFHGI GPVTAAKMEG LGVFSGADLA AKDPLWLAEH FANSAEWLYN 
LARGIDHRRV KSNRPLKSLG GERTFFNDLI TDTEIREALA HVCTVVWDRA VKKGARGRTV 
TLKLRYADFR TITRAKSVPS PIRDGASLLA VGEAILAPLL PSEQGIRLLG VTLSKFEGEE 
EEGDEAPAPA DLLSLI