Gene Sala_1941 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1941
Symbol
ID	4082890
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	2046540
End bp	2047787
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	68%
IMG OID	638010318
Product	succinylarginine dihydrolase
Protein accession	YP_616986
Protein GI	103487425
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3724] Succinylarginine dihydrolase
TIGRFAM ID	[TIGR03241] succinylarginine dihydrolase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGACCG AAATCAATTT CGACGGGATC ATCGGCCCGA CACACAATTA TGCGGGACTG 
AGCCGCGGCA ACATCGCGTC GGCGAGCCAC GCCGGCGACG TGTCGCAGCC GCGCGCTGCC 
GCGCTGCAGG GCATCGACAA GATGCGCCAC AATCTCGTGC TCGGTCTGCC GCAGGGTTTC 
TTCGTGCCGC TCGACCGCCC CGATGCGCCA TGGCTAGCGG CGCTCGGCAC GAGCGTCGAG 
AAGGCCGAGG GCCATTTGCG CGCGCAGGCC TGGTCGGCGT CGTCGATGTG GGCCGCGAAC 
GCCGCGACCG TCTCGCCCGC GCCCGACAGC GCCGACGGCA AATGCCATCT GACGGTCGCC 
AACCTCGTCA CCATGCCGCA CCGCAGCCAC GAATGGCCGG GAACGCTGGC GCAGCTCCGC 
CTTGCCTTTG CGCATCCCGC CTTTTCCGTC CATCCACCCG TTCCCGCTCC CTTCGGCGAC 
GAAGGCGCGG CAAACCATAT GCGGCTGTGC AGCGGCCACG ATAGGGTCGG CGTCGAAATC 
TTCGTCTATG GCGTCGCCGG GGGGCGCTTT CCGGCGCGCC AGCATCTCGA CGCCTCGAAG 
GCCATTGCGC GGCGCCACCG GCTCGACCCG GCGCGCACGC TCTTCATTCG CCAGTCGGAC 
ACCGCGATCC AGGGCGGCGC TTTCCATAAC GATGTCGTCG CCGTGGCGAA CGAGCATGTG 
CTGTTCACGC ACGAAACCGC ATTCGAGGAT CGCGAAGCCG CGCATGCCGA AATCCGCGCG 
GCCTTTCCCG CGGTCGAAAT CGTCGAGGTG CCCGCCAGCG CGGTGAGCCT GGCGCACGCG 
ATCAAATCCT ATCTGTTCAA CGCGCAGCTC GTCACCCTGC CCGAAGGCGG CATGGGGCTG 
GTCCTGCCGA CCGAGGCACA CGAAACGCCC GCAGTATGGA ACTGGCTGGA GGCGATGATC 
GTCGGCAACG GCCCGATCCG CCGTCTGTTT CCTGTCGATG TGCGGCAGTC GATGGCGAAC 
GGCGGCGGCC CGGCATGCCT GCGGCTGCGC GTCGTTGCCG ATCCCGCGAC CGTCGATCCA 
CGCTTCCTCG CCGACGAGGC GAAGCTCGAC CGGATCGCCG GGGTGGTTGC GAAACATTGG 
CCCGAAGCTA TCGCGCCCGC CGATCTCGCC TCGACCACGC TGCTCCATGA CGTGCGCAGG 
GCGCGCCTCG CGCTGCTCGA CGCGCTCGAC CTTTCCGAAC TCGGCTGA

Protein sequence

MLTEINFDGI IGPTHNYAGL SRGNIASASH AGDVSQPRAA ALQGIDKMRH NLVLGLPQGF 
FVPLDRPDAP WLAALGTSVE KAEGHLRAQA WSASSMWAAN AATVSPAPDS ADGKCHLTVA 
NLVTMPHRSH EWPGTLAQLR LAFAHPAFSV HPPVPAPFGD EGAANHMRLC SGHDRVGVEI 
FVYGVAGGRF PARQHLDASK AIARRHRLDP ARTLFIRQSD TAIQGGAFHN DVVAVANEHV 
LFTHETAFED REAAHAEIRA AFPAVEIVEV PASAVSLAHA IKSYLFNAQL VTLPEGGMGL 
VLPTEAHETP AVWNWLEAMI VGNGPIRRLF PVDVRQSMAN GGGPACLRLR VVADPATVDP 
RFLADEAKLD RIAGVVAKHW PEAIAPADLA STTLLHDVRR ARLALLDALD LSELG