Gene Rleg_6283 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_6283
Symbol
ID	8016154
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012852
Strand	-
Start bp	347467
End bp	348612
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	60%
IMG OID	644827586
Product	NMT1/THI5 like domain protein
Protein accession	YP_002978786
Protein GI	241258902
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.101312
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTGGTC CGCAGGTGGC CCGATCGGTG ACATCGGCCC GCAATAGCGA GCGCAATCGG 
TCGGTCGTCC AACAATCCAA CAAGGGGAAA GGCAAGCAAA TGAACGGGGA AGACAAACAA 
ATCGTGGTCG GCAGGCGTAC CGTCCTGAAG GGCGGAGCCT TTGCCCTTGC TGCAGCGACG 
GCAGGGATCA GCGTGTTCGT GCCGCGTCAC TCCAAAGCCG CCGCATCCAA GGTCGTCATC 
AAATATGACT GGCTGATGAG CAACGGACAG ATCGGCGATA TCGTCGCAGT CAAGCGTGGG 
CTGTTCGAGG CCGAGGGTCT CGACGTCGAG TTTTCCCCTG GTGGTCCCAA TTCGGCAACG 
GTGCCGCCCG TGATCACGGG TGATGCGCAG CTCGGCCAGT TCTCGGATTC GGCACAGCTT 
CTTCTTGCCA GGTCATCCGG CGTGCCGATC AAGATCTTCG CCTGCGGTTT CCGCATGGCG 
CCTTTCGCCT TCTATTCGCT GCCCAAGGCG CCGATCCGCA CCGTCAAGGA CATGATCGGC 
AAGCGCATCG GCATCCAGCC GACGGCTCGT TATGTCCTTG ATGCCATCCT GCTGAAGAAC 
AATATCGATC CCTCGAGCCT GACCATCACC AATATCGGCT TCGACATGAC GCCGCTGATG 
ACCGGTCAGG TCGATGCAGT GACCGGATGG ATCACTAACA CGCAAGCCCT TTCCATCATC 
GGCCCCGACC GCATTGATCT GATAATGAAG GACACGGGCC TGCCGTCCTA CGCCAACGTC 
TATTTTGCCA CCGACGATGC CGTGACCGGC CATGCTGAGA CATTGGCAAA GGTGTTGCGT 
GCGGTCGCCA AGGGTTGGGC CTGGACGCAT GACCATCCCG AAGAGGCGGT CAAATTGACG 
GTGGAGGCCT ATCCGCAGCT CGACCTTGCC GTGGAGCTGA AGACGATACC GCGCATATTG 
TCGCTGAGCT TCGACGCAGC AACGGGTAAG GATGGCTGGG GCAGTTTCGA TCCGGCGGCG 
CTTGCCGAAC AGATTTCCGT CTACGACAAG ATCGGCCAGT TCAAGAGCGG CGCGCCGAAG 
CTGGAGGACT GCTATACGGC CAAAATCCTG GACATGACGG CGGACGACCG CCCGAAGATT 
GCGTGA

Protein sequence

MRGPQVARSV TSARNSERNR SVVQQSNKGK GKQMNGEDKQ IVVGRRTVLK GGAFALAAAT 
AGISVFVPRH SKAAASKVVI KYDWLMSNGQ IGDIVAVKRG LFEAEGLDVE FSPGGPNSAT 
VPPVITGDAQ LGQFSDSAQL LLARSSGVPI KIFACGFRMA PFAFYSLPKA PIRTVKDMIG 
KRIGIQPTAR YVLDAILLKN NIDPSSLTIT NIGFDMTPLM TGQVDAVTGW ITNTQALSII 
GPDRIDLIMK DTGLPSYANV YFATDDAVTG HAETLAKVLR AVAKGWAWTH DHPEEAVKLT 
VEAYPQLDLA VELKTIPRIL SLSFDAATGK DGWGSFDPAA LAEQISVYDK IGQFKSGAPK 
LEDCYTAKIL DMTADDRPKI A