Gene Sala_1451 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1451
Symbol
ID	4081533
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	1500982
End bp	1502088
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	68%
IMG OID	638009816
Product	DNA alkylation repair enzyme-like protein
Protein accession	YP_616497
Protein GI	103486936
COG category	[L] Replication, recombination and repair
COG ID	[COG4335] DNA alkylation repair enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGCG AAACGCTGCT GCTAAAAAAT CTGCTGGGGC CGCAGGCCGT TGCGACGATC 
GCCGACGCCG GGACTGCCGC GACGCCGCAT TTCGACCGCC CGACGTTCGT GCGCGCCGCG 
TCGGAGGGCC TCGATGCGCT GTCGATCATG GAACGCGTGC GCCATATCGC CGATGCGCTG 
CACGGCGCGC TGCCAGGCGA TTATGGCGCG ACGCTCGATG CGCTGCGCGC AATGGCACCG 
CGACTGACGC ACGGCTTTCA GGCGATCGCG ATCACCGAAG TGGTGGCACG CCACGGCCTC 
GACGATTTCG ATCGCTCAAT GGCTGCGCTT GCCGATCTGA CGCGCTTTGG TTCGGCCGAG 
TTTGCGATCC GTCCGTTCCT GACCGCCGAT CCCGACCGCG CGCTGGCTAC GATGGGGCGC 
TGGACGACGA GCGACGACGA GCATGTGCGC CGCCTTGCGA GCGAGGGCGC GCGGCCGCGG 
CTGCCGTGGG CGGCGCGTGT CCCCGCGCTG AAGGTCGATC CGACGCGCGC CGCGCCGATC 
CTCGAGGCGC TGAAGGCCGA CCCTGCCCCC TATGTCCGCA AATCGGTCGC GAACCATCTC 
AACGATATTG CCAAGGACCG GCCGGGCTGG CTGGTCGAGC GCCTCGCGCA CTGGTCGCAG 
GACGACGAAC GCACCGCATG GATCGTCCGC CACGCGCTGC GCACATTGAT CAAGAAGGGC 
GACCCCGCCG CGCTCGCGCT GATCGGCGTC GGCCATGGCG CCGCAGTGAC ACTGCGCCGC 
TTTGCTGTCG AACCGGCCAG CGTCCGCCTT GGCGACCGGA TCGCCATCAC CGTTGCGTTG 
GCGTCGGAGT CACCCGACGA TCAGCCGTTG GTGGTCGACT ACCGCATCCA TTATGCCCGC 
CCCGGCGGCA AGAGTGCGCC GAAGGTGTTC AAGCTCAAGA GCTTCACGCT CGCGGGGCAC 
GATACCGCCG CGCTGTCGAT TTCACAGACG ATCCGCGATT TCACGACCCG CCGCCATCAT 
CCAGGGCGGC ACCGGGTCGA ACTGATGGTC AATGGCCAGG CGATGGCGGA GGCCGCCTTC 
GACATCGTTG CCGACGATGG CGCCTAG

Protein sequence

MSGETLLLKN LLGPQAVATI ADAGTAATPH FDRPTFVRAA SEGLDALSIM ERVRHIADAL 
HGALPGDYGA TLDALRAMAP RLTHGFQAIA ITEVVARHGL DDFDRSMAAL ADLTRFGSAE 
FAIRPFLTAD PDRALATMGR WTTSDDEHVR RLASEGARPR LPWAARVPAL KVDPTRAAPI 
LEALKADPAP YVRKSVANHL NDIAKDRPGW LVERLAHWSQ DDERTAWIVR HALRTLIKKG 
DPAALALIGV GHGAAVTLRR FAVEPASVRL GDRIAITVAL ASESPDDQPL VVDYRIHYAR 
PGGKSAPKVF KLKSFTLAGH DTAALSISQT IRDFTTRRHH PGRHRVELMV NGQAMAEAAF 
DIVADDGA