Gene Rleg_6461 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_6461
Symbol
ID	8017129
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012854
Strand	-
Start bp	179286
End bp	180599
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	60%
IMG OID	644828256
Product	nitrate ABC transporter, substrate-binding protein
Protein accession	YP_002979456
Protein GI	241554243
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.325074
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTAAGA ATTTGCAGAC TGGGATTTCG ACAACCGGCA TTACCCGCCG CAGCATGCTC 
AAGACGACTG CAGCGGCTGC CCTCATCGGC GCTGTCAAGA CGGCCTTTCC ATCCGGCGCC 
TTCGCAGCCG GAGCAGGCCC TGAGGTGAAG GGCGTCAAGC TCGGTTTTAT CGCTCTCACC 
GATTCCGCGC CGCTGATCAT CGCCAAGGAA AAGGGCTTTT TCGACAAGCA TGGCCTTCCG 
GAAACGGATG TGGCCAAACA GGCCTCCTGG GGTGCGACCC GCGACAACCT CGTGCTGGGT 
GGCGCCGCAA ACGGCATCGA CGGTGCGCAT ATCCTGTCGC CGCTCCCCTA TCTCATGCAT 
ACCGGCAAGG TGACGCAGAA CAATAAGCCG GTGCCGATGG CAATCCTCGC GCGGCTCAAC 
CTCGACAGCC AAGGCATTTC CGTCGCCAAG GAATATGCCG ACACCGGCGT GCAGCTCGAT 
TCCTCCAAGC TGAAGGCGGC ATTCGAGAAG AAGAAGGCGG AGGGCAAGGA GATCAAGGCC 
GCCATGACCT TCCCGGGCGG CACCCATGAC CTCTGGATCC GCTACTGGCT CGCCGCCGGC 
GGCATTGATC CGAGCAAGGA CGTTTCGACC ATCGTCGTGC CGCCGCCGCA GATGGTTGCC 
AACATGAAGG TCGGCAACAT GGACGTCTTC TGTGTCGGCG AACCGTGGAA TGAGCAGCTC 
GTCAACCAGG GCATCGGCTT TACCGCAGCC ACCACCGGCG AGCTCTGGAA GGGTCATCCT 
GAAAAGGCGC TCGGACTGCG CGCCGAATGG ATCGAAAAGA ATCCCAATGC TGCCAAGGCC 
CTGCTGATGG CTGTCATGGA GGCGCAGCAG TGGTGCGAAA GCATGGACAA CAAGGCGGAG 
ATGGCTGACA TTCTCGGCAA GCGCCAATGG TTCAACGTTC CGACCAAGGA CGTGCTCGGC 
CGCCTCAAGG GCGACATCAA TTATGGCAAT GGCCGCGAGG TCAAGGCCAC CGACCTCTAT 
ATGAAGTTCT GGAAAGACGG CGCCTCCTAT CCGTTCAAGA GCCACGACAC ATGGTTCATG 
ACGGAAAACA TCCGTTGGGG AAATCTGCCG GCGAGCACCG ACATCAAGGC GCTGGTCAAC 
CAGGTGAACC GTGAAGACAT CTGGCGCGAG GCCGCCAAGG ATCTCGGCGT CGCGGCGGCC 
GATATCCCCG CATCGTCTTC TCGCGGCAAG GAGACTTTCT TCGACGGCAA GGTCTTCGAC 
CCTGAAAATC CTTCGGCCTA TCTCGACAGC CTTTCGATCA AGGCTGTCTC CTGA

Protein sequence

MTKNLQTGIS TTGITRRSML KTTAAAALIG AVKTAFPSGA FAAGAGPEVK GVKLGFIALT 
DSAPLIIAKE KGFFDKHGLP ETDVAKQASW GATRDNLVLG GAANGIDGAH ILSPLPYLMH 
TGKVTQNNKP VPMAILARLN LDSQGISVAK EYADTGVQLD SSKLKAAFEK KKAEGKEIKA 
AMTFPGGTHD LWIRYWLAAG GIDPSKDVST IVVPPPQMVA NMKVGNMDVF CVGEPWNEQL 
VNQGIGFTAA TTGELWKGHP EKALGLRAEW IEKNPNAAKA LLMAVMEAQQ WCESMDNKAE 
MADILGKRQW FNVPTKDVLG RLKGDINYGN GREVKATDLY MKFWKDGASY PFKSHDTWFM 
TENIRWGNLP ASTDIKALVN QVNREDIWRE AAKDLGVAAA DIPASSSRGK ETFFDGKVFD 
PENPSAYLDS LSIKAVS