Gene Saro_2677 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2677
Symbol
ID	3918451
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	2914921
End bp	2916330
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	68%
IMG OID	640445454
Product	argininosuccinate lyase
Protein accession	YP_497947
Protein GI	87200690
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0165] Argininosuccinate lyase
TIGRFAM ID	[TIGR00838] argininosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGGCA ATTCGGGCTC CAACCAGATG TGGGGCGGGC GCTTCGCAGG CGGTCCCTCG 
GCGATCATGC GCGAGATCAA CGCCTCGATT CCCTTCGACA AGGCGTTGTG GCGGCAGGAC 
ATCGCCGCGT CAAAGGCCCA TGTGGACATG CTGGGCGCGC AAGGGATCGT CTCGGCCGAG 
GATGCGGCGC TGATCGCCAG TGGGCTCGAT CAGGTGGCAG CGGAGTACGA GGCCAACGGG 
GTGCCCGAGA ACTGGGACCT CGAGGACATC CACATGACCA CCGAGAGCCG CCTTGCCGAA 
CTGATCGGCC CGGCGGCGGG GCGCCTGCAC ACCGCGCGCA GCCGCAACGA CCAGGTGGCG 
ACCGACTTTC GCCTGTGGGT TCGCGACGCG ATGGACCAGG CCGAGCTGGG CCTGAAGCAG 
TTGCAGGTCG CGCTGGTGAG CCGCGCGGGC GAGCATGCCG CTTCGATCAT GCCCGGCTTC 
ACGCACCTGC AGACCGCGCA GCCGGTGACG CTGGGCCACC ACCTGATGGC CTATTACGAG 
ATGATCGGGC GCGACCGTTC GCGCTTTGCC GATGCGCGGG TGCGCATGAA CCGCAGCCCG 
CTCGGCTCGG CGGCGCTGGC CGGCACCGGC TTTCCCATCG ACCGCTTCCG CACTGCCGAG 
GCGCTGGGCT TCGATGGGCC GACTGACAAC AGCCTCGATT CGGTGTCGGA CCGCGACTTC 
GCGTTGGACT ACCTGATGGC CGCCGCGCAG TGCTCGCTGC ACCTGTCGCG GCTGGCCGAG 
GAATTCATCA TCTGGGCGAG CCAGCCCTTC GGCTTCGTGA CGCTGCCCGA CAGCCTTTCG 
ACCGGCAGCA GCATCATGCC GCAGAAGAAG AACCCCGACG CGGCCGAACT GGTGCGCGGC 
CATTCGGGCC GGATCGTCGG CTGCCTGACC GCGCTGATGA TCACGATGAA GGGCCTGCCG 
CTGGCCTATT CCAAGGACAT GCAGGACGAC AAGCCGCCGG TGTTCGAGGC CGCCAGCCTG 
CTGGCGCTGT CCATCGCGGC AATGACCGGG ATGGTGGCCG AGGCGAAGTT CCGGACCGAC 
CGCATGCGCG CCGCCGCCGA GCTTGGCTAT GCCACGGCGA CCGACCTTGC CGACTGGCTG 
GTGCGGCAGG CCAACATCCC GTTCCGCGAG GCGCACCACA TCACCGGTTC CGCGGTGAAG 
CTGGCCGAAT CGCGCGGGAT AGCGCTCGAC CAGCTTTCGA TCGAGGACCT CAAGGCGATC 
GACGAGCGCA TCGACGAGCG CGTCTATGCG GCTCTGTCGG TCGAGGCGAG CGTGGCGGCG 
CGTTGCAGCC ATGGCGGAAC CGCGCCGGAC GAGGTAAGGA AGCGCGTGGC CCAGGCGCGC 
GTGGCGCTGG GGCTGGAGGA ATCGGCTTGA

Protein sequence

MSGNSGSNQM WGGRFAGGPS AIMREINASI PFDKALWRQD IAASKAHVDM LGAQGIVSAE 
DAALIASGLD QVAAEYEANG VPENWDLEDI HMTTESRLAE LIGPAAGRLH TARSRNDQVA 
TDFRLWVRDA MDQAELGLKQ LQVALVSRAG EHAASIMPGF THLQTAQPVT LGHHLMAYYE 
MIGRDRSRFA DARVRMNRSP LGSAALAGTG FPIDRFRTAE ALGFDGPTDN SLDSVSDRDF 
ALDYLMAAAQ CSLHLSRLAE EFIIWASQPF GFVTLPDSLS TGSSIMPQKK NPDAAELVRG 
HSGRIVGCLT ALMITMKGLP LAYSKDMQDD KPPVFEAASL LALSIAAMTG MVAEAKFRTD 
RMRAAAELGY ATATDLADWL VRQANIPFRE AHHITGSAVK LAESRGIALD QLSIEDLKAI 
DERIDERVYA ALSVEASVAA RCSHGGTAPD EVRKRVAQAR VALGLEESA