Gene Rleg2_3089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_3089
Symbol
ID	6981834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	3151415
End bp	3152713
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	64%
IMG OID	643397799
Product	adenylosuccinate synthetase
Protein accession	YP_002282582
Protein GI	209550665
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0104] Adenylosuccinate synthase
TIGRFAM ID	[TIGR00184] adenylosuccinate synthase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.126084
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.070043
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAACG TAGTCGTGGT CGGTTCGCAA TGGGGTGACG AAGGCAAGGG CAAGATTGTC 
GACTGGCTTT CGGAGCGCGC GGATATCGTT GTGCGCTATC AGGGCGGACA TAATGCCGGC 
CATACGCTCG TCATCGACGG CACCAGTTAC AAGCTGTCGC TGCTGCCCTC CGGCGTCGTG 
CGCCCGGGCA AAATGGCGGT GATCGGCAAC GGCGTCGTCG TCGATCCGCA TGCGCTGATC 
GCCGAGATCG GTCGGCTGGA AGCCCAGGGC GTGACAGTGA CGCCCGACAA TCTGCGTATC 
GCCGACAATG CGACGCTCAT TCTGTCGCTG CACCGCGAAC TCGACGCGAT GCGCGAGGAT 
GCGGCGTCGA ACAGCGGCAC CAAGATCGGC ACGACACGCC GCGGCATCGG CCCTGCATAT 
GAAGACAAGG TCGGCCGCCG CGCCATCCGG GTGATGGATC TTGCCGATCT CGACAGCCTG 
GCCGGCAAGG TCGACCGTAT TCTGACGCAT CACAATGCGC TTCGCCGCGG CCTCGGCGTC 
GCCGAAGTCA GCCACCAGAC GATCATGGAC GAACTGACCT CGATCGCCGA TCGGGTGCTG 
CCGTTCCGTG ACACCGTCTG GCTTTTCCTC GACAAGGAGC GCCGCAAGGG CTCCCGCATC 
CTCTTCGAAG GCGCGCAGGG CAGCCTGCTC GACATCGACC ACGGCACCTA TCCTTTCGTG 
ACCTCGTCGA ACACCGTGGC CGGCCAGGCC GCGGCCGGTT CCGGCATGGG GCCGGGCTCG 
CTCGGCTATA TCCTCGGCAT CACCAAGGCC TATACGACGC GTGTCGGCGA AGGCCCGTTC 
CCGACGGAGC TGAAGGATGC GATCGGTGAG TTCCTTGGCG AAAAAGGCCA TGAGTTCGGC 
GTGGTGACCG GGCGCAAGCG GCGTTGCGGC TGGTTCGATG CCGCCCTCGT GCGCCAGTCG 
ATCGCCACCA ACGGCATCAC GGGCATCGCG CTCACCAAGC TCGACGTGCT CGACGGCCTT 
GAGGAGTTGA AGATCTGCGT CGGTTACATG CTCGACGGCG AACAGATTGA TCATCTTCCC 
GCAAGCCAGG GAGCGCAAGC TAGGGTCGAA CCGGTCTATA TCACGTTGGA AGGGTGGAAG 
GAATCGACCG TCGGCGCCCG CAGTTGGGCG GACCTGCCGG CACAGGCGAT CAAATATGTT 
CGCCAGGTCG AAGAGCTGAT CGGCGCGCCT GTCGCGCTGC TTTCCACCAG CCCGGAGCGG 
GATGACACGA TACTTGTGAC CGATCCGTTT GAGGATTAA

Protein sequence

MTNVVVVGSQ WGDEGKGKIV DWLSERADIV VRYQGGHNAG HTLVIDGTSY KLSLLPSGVV 
RPGKMAVIGN GVVVDPHALI AEIGRLEAQG VTVTPDNLRI ADNATLILSL HRELDAMRED 
AASNSGTKIG TTRRGIGPAY EDKVGRRAIR VMDLADLDSL AGKVDRILTH HNALRRGLGV 
AEVSHQTIMD ELTSIADRVL PFRDTVWLFL DKERRKGSRI LFEGAQGSLL DIDHGTYPFV 
TSSNTVAGQA AAGSGMGPGS LGYILGITKA YTTRVGEGPF PTELKDAIGE FLGEKGHEFG 
VVTGRKRRCG WFDAALVRQS IATNGITGIA LTKLDVLDGL EELKICVGYM LDGEQIDHLP 
ASQGAQARVE PVYITLEGWK ESTVGARSWA DLPAQAIKYV RQVEELIGAP VALLSTSPER 
DDTILVTDPF ED