Gene Rleg2_4640 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_4640
Symbol
ID	6977734
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	+
Start bp	273761
End bp	275119
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	60%
IMG OID	643393814
Product	nitrilotriacetate monooxygenase protein, component A
Protein accession	YP_002278632
Protein GI	209546714
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGGCGC GAACCGATAA GATGAAACTC GGAACTTTCG TCTATACGTT CGGCTTTCAT 
CCTGCCTCCT GGCTGCATCC GGCAAGCGAC GTCAACGGCG CCAACGACTT CGCGCATCTG 
CTCGATGTCG CCAAACGATC CGAGGCTGCG AAATTCGATT TCATGTTCAT GGCGGATTCT 
CCCGCCGCTG CCATCGGTGA TGCGAATGCA CTTGCCCGCA TTCCGACCAA GATGAACCGT 
TTCGAACCCC TTTCGCTGCT TTCGGCTCTG GCGGTCACAA CGGATAATCT CGGTCTCGTG 
GCGACGGTCT CGACGAGTTA TTACGAGCCG TACAATGTCG CGCGTCTGTT CGCCTCGATC 
GATCATCTGA GCAGGGGGCG CGCCTGCTGG AACGTCGTCA CCTCCGACCA CGACGAAACC 
GGTTACAACT TCAACCGCGA GGGGCTCGAC CCGCATGCGT TGCGCTATGA GCGCGGCAAC 
GAATTCGTCG ATGTCGTGTT CGGCCTTTGG GACAGCTTCG AGGAAGGCGC GTTGCTTCTC 
GACCGTGAAA ACGGTGTCTA TTATGACAAG AGCAAACACC ATACCCTCAA TCACAAAGGC 
AAGCACTTCC AGGTTCGCGG CCCCCTCAAC ATCGCCCGAA CGCCGCAGGG CCGCCCCGTC 
ATCGCCCAGG CGGGCGGTTC GGAACCCGGA ATGGACATGG CGGCGCGCAC GGCAGAGATC 
GTCTTCAGCC TCGCCTCGAA TATCGAGCGT AACCGGGCCT TCTACGAAAA CGTCAAGCGT 
CGGATGCCGG CCTATGGACG TGATGCGGAC GACCTGAAGA TCATGCCGGG CATCGTTATC 
AACGTCGGTG AAACCGAAGC CGAGGCAAAG GCGAAGGTGG ATTATCTGAT CGATATGATG 
CATCCCGATG TTGGCCGGCT GATGCTCTCC GAATTCCTCG AGGCGGACCT GCGCGACGTG 
GCCCTCGACA AGCCTTTCCC CATGGAGCGG CTGCCCGCCG CGCCAAAGGG CTCACGCGCT 
CTGTTCGACG AACTGGTCGA TTTCGTAAGA AGCGGCCACA CCGTCGGCGA ACTCATCCGG 
CACTATGCCG AGAAGCATAC CGGAAATGGC GTGACAGGCA CGCCATCCCA GATTGCCGAC 
TTCATGGAGG AATGGTTCGA GACGCGCGCC GCCGACGGCT TCATCCTGAT GTTTCCGACT 
TTGCCGTCCA GTCTCGACGA CTTCGTGCGG CTCGTTCTGC CCGAGCTTCG CCGCCGCGGA 
CTGTTTCGCG AGGAATACGA GGGCAGAACC TTGCGCGAGA ACCTGGGCCT CTCGATGCCG 
GCGAACCGCT TTGCCAAAAC GCGATTAGCA GGCCGATGA

Protein sequence

MVARTDKMKL GTFVYTFGFH PASWLHPASD VNGANDFAHL LDVAKRSEAA KFDFMFMADS 
PAAAIGDANA LARIPTKMNR FEPLSLLSAL AVTTDNLGLV ATVSTSYYEP YNVARLFASI 
DHLSRGRACW NVVTSDHDET GYNFNREGLD PHALRYERGN EFVDVVFGLW DSFEEGALLL 
DRENGVYYDK SKHHTLNHKG KHFQVRGPLN IARTPQGRPV IAQAGGSEPG MDMAARTAEI 
VFSLASNIER NRAFYENVKR RMPAYGRDAD DLKIMPGIVI NVGETEAEAK AKVDYLIDMM 
HPDVGRLMLS EFLEADLRDV ALDKPFPMER LPAAPKGSRA LFDELVDFVR SGHTVGELIR 
HYAEKHTGNG VTGTPSQIAD FMEEWFETRA ADGFILMFPT LPSSLDDFVR LVLPELRRRG 
LFREEYEGRT LRENLGLSMP ANRFAKTRLA GR