Gene Rleg2_1101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_1101
Symbol
ID	6979820
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	1123302
End bp	1124363
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	61%
IMG OID	643395813
Product	putative adenylate/guanylate cyclase
Protein accession	YP_002280621
Protein GI	209548704
COG category	[T] Signal transduction mechanisms
COG ID	[COG2114] Adenylate cyclase, family 3 (some proteins contain HAMP domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.969933
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.21412
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGAAA TATCTCCGAC GCAGAACTGG ATCCTGATCA CGATGGTTCT GGCTGCCAGC 
GGCGTCGTCT ATGATCTGAT GTTCTACTCC AATCAGACGC CCGTTGTCGG CGCGATCTTC 
GCGCTGTTCA TCGGCATGCC GATCATCGCC TTCGAGCGCA AGGCGCTGTT CCGCACGCTG 
TACAGGCGTA TCCAGAAGCT GCCGACCTTC GCTTTCATCA TCAGCGAGCT GGTGATCTAC 
GAGATCCTGA TGAGCATCGG CTTTGCCTGC GCCGCGCTGC TGCTCTCGTC GCTCGGCATG 
GTGAAGCCAA CATCGTTCCT CGATCTCGTC ATCATGCCCT ACGAGGTCTT CCTCTATGCG 
CTTGCCGTCT GCTCGGCGCT GATCTTCATC CTGCGCGTGC GGGAGCTGCT CGGCCGCGAG 
GTATTCGTCA GCATGCTGGT CAGCCGCTAC CGCAATCCAG TCAGGGAAGA GCGTGTCTTC 
CTGTTCATCG ACCTGGTCGA CTCGACGGCT TTTGCCGAAA AGCACGGCGA CCTTCGTGCG 
CAGCAGCTGC TGAGCTCGCT GTTTGCGACC TTCGCCGAGC CCGTCAGGCG CCATAAGGGC 
ATGATCAACG ACTATGTCGG CGATGCGGCG ATCATCACCT GGCCGCTTGC CCGCGGCATC 
AAGGGCGCGC GCTGTGTGCG CTGCATCTTC GACATCCTCG CCGATATCGA AGCCAACGCC 
GCCGGCTGGC GGAAAAGCTA CGGACAGGTG CCGAAGCTGC GCGCCGCCCT TCACGGCGGC 
GAGATCATCA CCGCCGAAAT TGGCGTCGAT CATCACAAGA TCAGCTATTT CGGCGACACG 
GTGAACACCA CCGCCCGGCT GGAAACGCTC TGCCGCAGCC TCAATCGGCC AGTGCTGATT 
TCGGCCGACC TTGCGCAGCG CATGAAATTT CCCGACGATA TATCCTGCGA GGATCTCGGC 
ACCCATGCCG TCAGGGGGCG CGGCCAGGCG CTCGGCGTCA TGGCGCTTTC CTCACGCGCG 
GTGACTGTGC TGAACACGCC TGCCGTCATT CTGCACGGCT GA

Protein sequence

MREISPTQNW ILITMVLAAS GVVYDLMFYS NQTPVVGAIF ALFIGMPIIA FERKALFRTL 
YRRIQKLPTF AFIISELVIY EILMSIGFAC AALLLSSLGM VKPTSFLDLV IMPYEVFLYA 
LAVCSALIFI LRVRELLGRE VFVSMLVSRY RNPVREERVF LFIDLVDSTA FAEKHGDLRA 
QQLLSSLFAT FAEPVRRHKG MINDYVGDAA IITWPLARGI KGARCVRCIF DILADIEANA 
AGWRKSYGQV PKLRAALHGG EIITAEIGVD HHKISYFGDT VNTTARLETL CRSLNRPVLI 
SADLAQRMKF PDDISCEDLG THAVRGRGQA LGVMALSSRA VTVLNTPAVI LHG