Gene Smed_4987 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4987
Symbol
ID	5318800
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	1500441
End bp	1501907
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	64%
IMG OID	640776769
Product	argininosuccinate lyase
Protein accession	YP_001313701
Protein GI	150377105
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0165] Argininosuccinate lyase
TIGRFAM ID	[TIGR00838] argininosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.00718333
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCTGAAC CCACTCAGCT CTGGGGTGGA CGATTCAAGT CCGGACCGTC CGAAGCGCTT 
GCAAATCTGT CACGCGCGCC GAGCTCTTAC TTTCGCCTTT ACAGAGAGGA TATTGCGGGG 
TCGCGCGCTC ATGCTTCGGA ATTGAAGCGC GCCGGCGTCC TTGACGAGGG CGAATTCTCC 
GCGATACGAG CAGCCCTGGA AGCGATCGAA ACCGATGTCG GTGCCGGCCA TGAGAAGCCG 
ATTGCCGCTG ACGAGGATCT GCATACCTTT CTCGAACGCC TGCTGATGGC GCGCCTCGGC 
GCCCTTGGCG GCAAGCTTCG CGCCGGACGT TCCCGCAACG ATCAGACTGC GAACAATACG 
CGCCTTTATC TACGGCGTAT GGCGCGGGAG CTTTCCCGAG GCATTATCGC CGTCGAGGAA 
GCGCTGACGG AGCAGGCATC CCGGCATACG GAAACGGTAA TGCCCGGCTT TACTCATCTC 
CAGCCGGCCC AGCCGGTCGT GCTCGGGCAC CACCTCATGG CGCATGCGCA GTCGCTGCTG 
CGCGACCTTC AGCGTTTCGC GGATTGGGAC CGCCGATTCG ATCGGTCGCC GCTTGGCGCG 
GCCGCGCTAG CGGGATCGGG CATTGCCCGC CGTCCCGACC TTTCCGCCGT CGATCTCGGC 
TATTCGGCCG CGTGCGAGAA CTCCATCGAT GCTGTCGCAG CGCGCGACCA TGTCGCGGAG 
TTTCTCTTCA TCTGCTCGCT GGTGGCGGTG GATCTCTCCC GGCTTGCGGA GGAAATCTGC 
CTTTGGAGCT CCAAACAGTT CAGCTGGGTG CGGCTCGATG ATGCCTATTC CACAGGTTCC 
TCGATCATGC CGCAGAAGAA GAATCCCGAC GTCGCCGAAC TGACGCGCGG CATGTCCGGC 
ACGCTGATCG GCAACATTGC CGGGTTCCTG GCGACCATGA AGGCGATGCC GCTCGCCTAT 
AATCGCGACC TTGCCGAAGA CAAGCGCAGC CTGTTCGAGA CGATCGACAT TCTCGACCTG 
GTCCTGCCGG CCTTTGCCGG CATGGTGGGG ACGCTGGAAT TCGACGTGGA GAAACTGCGG 
GAGGAAGCGC CGAAGGGCTT CACCCTGGCG ACCGAAGTCG CCGACTGGCT GGTCGGACGG 
GACGTGCCCT TTGCGGAAGC GCACGAGATT ACCGGGGCCG TGGTCCGCTA CTGCGAAGAG 
CGCGGTCATG ATCTTGCCGG GCTGACCCCC GACGACCTGG CGAAGATCGA TCCGCGTCTT 
CACGCCGGGA TGCTCGCAGC GCTCACACTC GACAAGGCGC TTGCGAGCCG CACCGGATAC 
GGCGCAACCG CGCCGGAAAG GGTTCGCGAG CAGATCGCCC GTTTCGAAAC GGCACTTGCC 
GAATGCCGGG CCTTTGCTGC CGCCCCATCC GGCGGGGCGG CCTTTGCGGG TCCGAAGAGC 
GACGTAGAGG AGGAGCGACG TCGATGA

Protein sequence

MAEPTQLWGG RFKSGPSEAL ANLSRAPSSY FRLYREDIAG SRAHASELKR AGVLDEGEFS 
AIRAALEAIE TDVGAGHEKP IAADEDLHTF LERLLMARLG ALGGKLRAGR SRNDQTANNT 
RLYLRRMARE LSRGIIAVEE ALTEQASRHT ETVMPGFTHL QPAQPVVLGH HLMAHAQSLL 
RDLQRFADWD RRFDRSPLGA AALAGSGIAR RPDLSAVDLG YSAACENSID AVAARDHVAE 
FLFICSLVAV DLSRLAEEIC LWSSKQFSWV RLDDAYSTGS SIMPQKKNPD VAELTRGMSG 
TLIGNIAGFL ATMKAMPLAY NRDLAEDKRS LFETIDILDL VLPAFAGMVG TLEFDVEKLR 
EEAPKGFTLA TEVADWLVGR DVPFAEAHEI TGAVVRYCEE RGHDLAGLTP DDLAKIDPRL 
HAGMLAALTL DKALASRTGY GATAPERVRE QIARFETALA ECRAFAAAPS GGAAFAGPKS 
DVEEERRR