Gene Sala_2022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_2022
Symbol
ID	4079959
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	2132342
End bp	2134015
Gene Length	1674 bp
Protein Length	557 aa
Translation table	11
GC content	66%
IMG OID	638010398
Product	protein of unknown function DUF853, NPT hydrolase putative
Protein accession	YP_617066
Protein GI	103487505
COG category	[R] General function prediction only
COG ID	[COG0433] Predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.27586
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0150658
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCGGG TTTGCAGATT GCTTGTGCGC CGACGCCGTT CTAACCGTTG CAGCGGGTTA 
TCCAGCGGAG GATGGCGAGT GAGCGAAGGC AGCGCGGCGA GCGAAATCTA TATCGGCCTC 
GGCGGCGGCG GGGCGCCCGA GGGGCCGCGG CAGTCGCTGG TGCTGAAGCG CGCGAACCGG 
CACGGGCTGA TCGCCGGCGC AACGGGGACC GGCAAGACGG TGACGTTGCA GGGGTTGGCC 
GAAGGCTTTT CGGCAGTGGG TGTGCCGGTC TTCGTCGCCG ACGTGAAAGG CGACCTTGCC 
GGCATGGCGA TGGCGGGAAG CCCGACCGCC AGGGTTCACG AGCCCTTTTC GAAGCGTGCC 
GCCGAAATCG GTGACACCGA CTGGGCCTAT CGCGACAATC CCGTGATCTT CTGGGACCTG 
TTCGGCGAAC AGGGGCATCC GGTGCGCACG ACGATCTCCG AAATGGGGCC GCTGCTGCTT 
GCGCGGCTGA TGGGGCTCAA CGAGACGCAG GAAGGGGTGC TCGCGATTGC GTTTAGGGTA 
GCTGACGAGC AGAATATGTT GCTGCTCGAC CTGGGCGATT TGCAGGCGAT GCTCGTCTGG 
TGCGCCGAAA ATGCCGATGA GCTGACAGCG AAATATGGCA ATGTCACCAA GGCGAGCGTC 
GGGGCGATCC AGCGGCAGCT GCTGACGCTC GAAAGCCAGG GCGGCGATCA TTTCTTCGGC 
GAACCCGCGC TCGACATTCA GGACATGATC CGTACCGACG AGAATGGCCG CGGCTATGTG 
AACATCCTTG CCGCCGACAG GCTGATGGCG AGCCCCAAGC TCTATGCGAC CTTTCTCCTC 
TGGCTGCTGA GCGAGATGTT CGAGACGCTG CCCGAGGTCG GCGATCCCGA CAAGCCGAAG 
CTGGTTTTCT TCTTCGACGA GGCGCATCTG CTGTTCGACG ATGCCCCGCC CGCGCTCACC 
GACAAGATTG AACAGGTCGT GCGCCTGATC CGCTCGAAAG GGGTCGGCGT CTATTTCGTC 
ACGCAAAACC CGATCGACAT TCCCGAGGCG GTCGCGGGTC AGCTGGGCAA TCGCGTCCAG 
CACGCGCTGC GCGCCTTTAC CCCGCGTGAT CAGAAGGCGG TGAAGGCCGC CGCGGACACC 
TTTCGCCCCA ATCCGAAGAT CGATGTGGCG CGTGAGATCA CCGAGCTGCG CGTTGGCGAG 
GCGCTGGTGT CGCTGCTGAT GCCCGATGGC GCCCCGTCGC CGGTCGAGCG CACATTGATC 
AAGCCGCCTT GCTCGCGCGC GGGGCCGCTC GATGCCAAGG AACGCGCGAT CATCCGGTCG 
ATCTCGCCGG TCGAGGGCAA ATATGACACG GCGGTCGACC GCGAAAGCGC CGAGGAACTG 
CTCGCCGTCA AGGCCGAGCA GGCGCAGGCG GCCGCGATCG AGGCGAAGGC GCAGGAGGAG 
GCCGACAAGG CGGCCGCGAT CGCGGCGAAG GAAGAGGCGA AGCGCAAGGC GGCCGAGGAG 
CGCGAGCGCA TCCGGCTGGA AAAAGCGGCG GCACGCGAGG CAGCGAAACC GAGCATGGCC 
GAAAAGATGG TGCAGTCGGC GGCGCGTTCG GCGGCGACGA GTCTCGGGCG CCAGGTTGCG 
GGCCGACTGG GCGGTCAGCT GATGCGCGGG ATTTTGGGAA GCCTGTTCAA ATAG

Protein sequence

MARVCRLLVR RRRSNRCSGL SSGGWRVSEG SAASEIYIGL GGGGAPEGPR QSLVLKRANR 
HGLIAGATGT GKTVTLQGLA EGFSAVGVPV FVADVKGDLA GMAMAGSPTA RVHEPFSKRA 
AEIGDTDWAY RDNPVIFWDL FGEQGHPVRT TISEMGPLLL ARLMGLNETQ EGVLAIAFRV 
ADEQNMLLLD LGDLQAMLVW CAENADELTA KYGNVTKASV GAIQRQLLTL ESQGGDHFFG 
EPALDIQDMI RTDENGRGYV NILAADRLMA SPKLYATFLL WLLSEMFETL PEVGDPDKPK 
LVFFFDEAHL LFDDAPPALT DKIEQVVRLI RSKGVGVYFV TQNPIDIPEA VAGQLGNRVQ 
HALRAFTPRD QKAVKAAADT FRPNPKIDVA REITELRVGE ALVSLLMPDG APSPVERTLI 
KPPCSRAGPL DAKERAIIRS ISPVEGKYDT AVDRESAEEL LAVKAEQAQA AAIEAKAQEE 
ADKAAAIAAK EEAKRKAAEE RERIRLEKAA AREAAKPSMA EKMVQSAARS AATSLGRQVA 
GRLGGQLMRG ILGSLFK