Gene Rleg_4040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4040
Symbol
ID	8014845
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	4118856
End bp	4120079
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	60%
IMG OID	644826609
Product	argininosuccinate synthase
Protein accession	YP_002977820
Protein GI	241206724
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0137] Argininosuccinate synthase
TIGRFAM ID	[TIGR00032] argininosuccinate synthase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATCAT ACAAAGACGT GAAGAAAGTC GTTCTCGCCT ATTCCGGCGG CCTCGACACC 
TCGATCATCC TGAAGTGGCT GCAGACGGAA CTCGGCGCCG AAGTCGTCAC CTTCACCGCC 
GATCTCGGCC AGGGCGAAGA GCTGGAGCCG GCGCGCAAGA AGGCCGAAAT GCTCGGCATC 
AAGGAGATCT ATATCGAGGA TGTGCGCGAG GAATTCGTAC GCGATTTCGT CTTCCCGATG 
TTCCGCGCCA ATGCCGTCTA CGAAGGCGTC TACCTGCTCG GCACCTCGAT CGCCCGTCCG 
TTGATTTCCA AGCATCTGAT CGATATCGCC AAGAAGACCG GCGCCGATGC GATCGCCCAC 
GGCGCGACCG GCAAGGGCAA CGACCAGGTC CGGTTCGAGC TCTCCGCCTA TGCCCTGAAC 
CCCGACATCA AGATCATCGC GCCGTGGCGC GACTGGGCGT TCAAGAGCCG CACCGACCTG 
CTGGCTTTCG CCGAGCAGCA TCAGATCCCT GTTGCCAAGG ACAAAAAGGG CGAGGCGCCA 
TTCTCCGTCG ACGCCAACCT TCTGCATTCC TCTTCCGAGG GCAAGGTTCT CGAGGACCCC 
TCCAAGGAGG CGCCTGAATA TGTGCACATG CGCACCATTT CGCCTGAGGC TGCACCCGAC 
AAGGCAACGA CCATCAAGGT CGGCTTCGAA AAGGGTGATG CGGTTTCGAT CAACGGCGTG 
CGCATGAGCC CGGCGACGCT CTTGGCTGCG CTCAACAATT ACGGACGAGA CAACGGCATC 
GGTCGTCTCG ACCTCGTCGA GAACCGTTTT GTCGGCATGA AGTCGCGCGG CGTCTACGAG 
ACCCCAGGCG GCACCATCCT GCTTTCGGCG CACCGCGCCA TTGAATCGAT CACGCTCGAC 
CGCGGTGCCG CCCATCTCAA GGACGACATC ATGCCGCGTT ACGCCGAGCT GATCTATTAC 
GGCTTCTGGT TTTCGCCGGA GCGCGAGATG CTGCAGGCGC TGATCGACAA GAGCCAGGAG 
CATGTCGAAG GCGAAGTGAC GCTGAAGCTC TACAAGGGCA ATGTCATGGT CATCGGCCGT 
GAAAGCGACA AGTCGCTCTA TTCCGACAAG CTCGTCACTT TCGAGGATGA CCAGGGCGCC 
TACGACCAGA AGGATGCGGC CGGCTTCATC AAGCTCAACG CGCTGCGCCT GCGCACGCTC 
GCCAAGCGCA ATCTCGTGAA GTAA

Protein sequence

MASYKDVKKV VLAYSGGLDT SIILKWLQTE LGAEVVTFTA DLGQGEELEP ARKKAEMLGI 
KEIYIEDVRE EFVRDFVFPM FRANAVYEGV YLLGTSIARP LISKHLIDIA KKTGADAIAH 
GATGKGNDQV RFELSAYALN PDIKIIAPWR DWAFKSRTDL LAFAEQHQIP VAKDKKGEAP 
FSVDANLLHS SSEGKVLEDP SKEAPEYVHM RTISPEAAPD KATTIKVGFE KGDAVSINGV 
RMSPATLLAA LNNYGRDNGI GRLDLVENRF VGMKSRGVYE TPGGTILLSA HRAIESITLD 
RGAAHLKDDI MPRYAELIYY GFWFSPEREM LQALIDKSQE HVEGEVTLKL YKGNVMVIGR 
ESDKSLYSDK LVTFEDDQGA YDQKDAAGFI KLNALRLRTL AKRNLVK