Gene Rleg2_3647 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_3647
Symbol
ID	6982409
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	3775810
End bp	3776820
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	61%
IMG OID	643398369
Product	NMT1/THI5 like domain protein
Protein accession	YP_002283136
Protein GI	209551219
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCTTC TCACCCGTCG CCAGACGATT TTCGCCGCCA TCGCGGCAAG CCTTGCCGGC 
CGCCCGGCCT TCGCCCAGTC GACACCCGCA AAGGCTCGCA TCGCGCTCGA CTGGACGCCC 
AACACCAACC ATATCGGTAT CTATGTCGCC CAGGCGAAGG GTTTTTATGC AGCCGCTGGC 
CTCGATGTCG ACATTCTACC CTATGCCGAT ACGAGTGCCG GAACGCTGGT CTCGAACGGC 
GTCGCCGACT TCGGCATCAG CAGCGAGATC GAGGCCATCA CGCAGCGCGC CGGCGGCGGT 
GACGTGAAGA TGGTCTACGG CGTCGTTCAG ACCGAAACAG CGCGCCTGAT CTTCAAGGGC 
GGACGCGACG ACATCAAGAG CCCCAGGGAT CTCGACGGCA AGACCTATGG CGGCTTCGGC 
GGCACCTGGG AGAGCGCGCT GATCTCCGCG ATGATCCGCA ATGACGGCGG CAAAGGCGAG 
GTCAAGACCG TCACGCTCGG CACCTCCGCC TACGAGGCGC TGGATAATGG CTCGATCGAT 
TTCACCCTGG AGATCTATAC CTGGGAAGGC GTCGCCGCCG AACTGGAAAA CCGGAAGATC 
GCCCGCTTCC ACTATTCCGA CTATGGCATT CCCGACGAGC AGACCACGGT CATCGTCTCC 
AGCGACGCTT ATCTCTCGGC CAATCGCGAC AATGCCCGCG CTTTCATTCA GGCGACGCGG 
AAGGGTTATG CCTATTCCGT CGATCATCCC GACGAAGCCT GCGCGCTGCT GATAGCGGAG 
AGCAACGGCG CGCTGATGAA CGCCGAATTG GTGAAAGCGT CGCAGAAGGC ACTGATCGAA 
GGACACTTCC TGAAATCCGA GGCCGGTGTG ATCGGCACCC TCGATCCGGC CAAGGCCGAT 
GCTATCGGCG GTTTCCTGGT CGAGAACGGC ATTCTGGTCG ATGCGAATGG CACCGCACTC 
AAGGAGAAGC CGGACTTTTC CACCTATTAT ACCAACGACC TGCTGGCCTG A

Protein sequence

MLLLTRRQTI FAAIAASLAG RPAFAQSTPA KARIALDWTP NTNHIGIYVA QAKGFYAAAG 
LDVDILPYAD TSAGTLVSNG VADFGISSEI EAITQRAGGG DVKMVYGVVQ TETARLIFKG 
GRDDIKSPRD LDGKTYGGFG GTWESALISA MIRNDGGKGE VKTVTLGTSA YEALDNGSID 
FTLEIYTWEG VAAELENRKI ARFHYSDYGI PDEQTTVIVS SDAYLSANRD NARAFIQATR 
KGYAYSVDHP DEACALLIAE SNGALMNAEL VKASQKALIE GHFLKSEAGV IGTLDPAKAD 
AIGGFLVENG ILVDANGTAL KEKPDFSTYY TNDLLA