Gene Sala_0201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_0201
Symbol
ID	4082117
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	215765
End bp	217171
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	70%
IMG OID	638008560
Product	argininosuccinate lyase
Protein accession	YP_615258
Protein GI	103485697
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0165] Argininosuccinate lyase
TIGRFAM ID	[TIGR00838] argininosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAATA CTCCGGACAA GAGCAGCATG TGGGGCGGCC GCTTCGGTGG CGGACCGGCG 
GCGATCATGC AAGAGATTAA CGCCTCGATC CCCATCGACA AGCGCCTTTG GGAAGAGGAC 
ATCGCCGCCA GCCGCGCCCA CGCCGCGATG CTCGGTGCTT GCCGAATCAT CAGTGCCGAC 
GATGCGGCAG CGATCGACCG CGGTCTTGCC CAGATCGCCG AAGAATTTGC CGAAAACGGC 
GTGCCCGTCG ACCTCAGCCT CGAGGACATC CACATGACCG TCGAGGCGCG GCTGAAGGAG 
TTGATCGGCG AACCCGCCGG GCGCCTCCAC ACCGCGCGCT CGCGCAACGA CCAGGTCGCG 
ACCGATTTCC GCCTGTGGAC GCGTACCGCC TGCGAGCGCA TCGACGCCGG GCTCGCCGCG 
CTCCAGTCGG CGCTGCTTCA GCGCGCCGAC GAGCATGCCG ACAGCATCAT GCCGGGCTTC 
ACGCATTTGC AGGTCGCGCA GCCGGTGACG CTCGGCCACC ATCTGCTCGC CTATGTCGAA 
ATGGCGCGCC GCGACCGCGG CCGCTTCGCC GATGCGCGCC GCCGCCTCAA CGAATCGCCG 
CTCGGCGCCG CGGCGCTCGC GGGGACGGGC TTTCCTGTCG ATCGCGACGC CACCGCTGCG 
GCGCTCGGCT TCGACCGGCC GATGGCGAAC AGCATCGACG CGGTATCCGA CCGCGACTTC 
GCGCTCGAGT TCTGCGCCGC CGCGGCGATC GCCGCGATCC ACCTGTCGCG CCTTGCCGAA 
GAAATCGTCA TCTGGGCCAG CCAGCCCTTC GGCTTCGTCG CGCTGCCCGA TGCCTGGTCG 
ACGGGCAGTT CGATCATGCC GCAAAAGCGC AACCCCGACG CCGCCGAACT GGTGCGTGGG 
CGCGCGGGCC TGCTGCTCGG CGCCTTCCAG CGGCTCGCCG TCATCGTCAA AGGGCTGCCG 
CTCACCTATT CGAAAGACCT TCAGGACGAC AAGGAAACGC TCTTCGGCGC GTTCGACGCG 
CTCGCGCTGT CGCTCGCGGC GATGACGGGC ATGGTCGAAA CGCTGAGCTT CCGCACCGAC 
CGGATGCGCG CGCTCGCCGC GTCGGGCTAT TCGACCGCGA CCGACCTTGC CGACTGGCTG 
GTGCGCGAGG CGGGGCTGCC GTTCCGCGAA GCGCATCATG TCGTCGGCGC CTGCGTCAGG 
CGCGCCGAGG AACTGGGCGT CGAGCTGCCC GCGCTGCCCG CCGCCGACGC GGCGGCGATC 
CACGCCGCGG TCACCCCCGA TGTCCTCGCC GCACTCACGG TCGAAGCATC GGTCGCCAGC 
CGCATGAGCT ATGGCGGGAC CGCGCCCGAA CGGGTAAGAC AGGCCATCGC TGCGGCGCGC 
GCTGCCGCGG CCCAGGGACA GGATTGA

Protein sequence

MANTPDKSSM WGGRFGGGPA AIMQEINASI PIDKRLWEED IAASRAHAAM LGACRIISAD 
DAAAIDRGLA QIAEEFAENG VPVDLSLEDI HMTVEARLKE LIGEPAGRLH TARSRNDQVA 
TDFRLWTRTA CERIDAGLAA LQSALLQRAD EHADSIMPGF THLQVAQPVT LGHHLLAYVE 
MARRDRGRFA DARRRLNESP LGAAALAGTG FPVDRDATAA ALGFDRPMAN SIDAVSDRDF 
ALEFCAAAAI AAIHLSRLAE EIVIWASQPF GFVALPDAWS TGSSIMPQKR NPDAAELVRG 
RAGLLLGAFQ RLAVIVKGLP LTYSKDLQDD KETLFGAFDA LALSLAAMTG MVETLSFRTD 
RMRALAASGY STATDLADWL VREAGLPFRE AHHVVGACVR RAEELGVELP ALPAADAAAI 
HAAVTPDVLA ALTVEASVAS RMSYGGTAPE RVRQAIAAAR AAAAQGQD