Gene Rleg_0936 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_0936
Symbol
ID	8015498
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	922455
End bp	924020
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	64%
IMG OID	644823520
Product	protein of unknown function DUF853 NPT hydrolase putative
Protein accession	YP_002974771
Protein GI	241203675
COG category	[R] General function prediction only
COG ID	[COG0433] Predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.222531
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGAGG ATGGCAAGAT TTTCATCGGC GCGAGCCGCA ATCCCGATGA CAGCATCAAC 
AAGCCAGAAT ATCTCGACCT GAAATTCGGC AACCGTCACG GCCTCGTCAC CGGCGCCACC 
GGTACCGGCA AGACGGTGAC ACTGCAGGTG CTGGCCGAAG GCTTCTCGCG GGCCGGCGTT 
CCGGTATTTG CGGCCGATAT CAAGGGCGAT CTTTCCGGCA TCGCCGCCAA GGGCGAGCCG 
AAGGATTTCC TGACGAAGCG CGCCGAGCAG ATCGGTTTCA CCGACTATGA ATTCGACCAG 
TTTCCGGTGA TTTTCTGGGA TCTGTTCGGC GAGAAGGGCC ACCGGGTGCG CACCACCATC 
GCCGAGATGG GACCGCTGCT GCTCGCCCGT CTGATGGATG CCTCCGAACC GCAGGAAGGC 
GTCATCAACA TTGCCTTCAA GATCGCCGAC CAGGGCGGGC TGCCGCTGCT CGACCTCAAG 
GATTTCAGCT CGCTGCTCAA CTATATGGGC GAGAACGCCA GCCAACTTTC CAACCAGTAC 
GGCCTGATCT CCAAGGCCTC GGTCGGCTCG ATCCAGCGGG CGCTGCTCGT TCTCGAACAG 
CAGGGTGCGG AGCACTTCTT CGGCGAACCG GCGCTGAAGA TTTCCGACAT CATGCGCACC 
AGCAACAACG GCTACGGCCA GATCTCGGTG CTGGCCGCCG ACAAGCTGAT GATGAACCCG 
CGGCTTTACG CCACTTTCCT GCTCTGGCTG CTTTCCGAAC TCTTCGAGGA ACTGCCCGAG 
GTGGGCGACC CCGACAAGCC GAAGCTCGTC TTCTTCTTCG ACGAGGCGCA CCTGCTCTTC 
AACGATGCGC CGAAGGTGCT GACCGAACGT GTCGAGCAGG TGGTGCGGCT GATCCGTTCC 
AAGGGCGTCG GCGTCTATTT CGTGACGCAG AACCCGCTCG ACGTGCCGGA AACGGTGCTC 
GCCCAGCTCG GCAACCGGGC GCAGCACGCG CTTCGCGCCT ATTCGCCGCG CGAGCAGAAG 
GCGGTGCGGA CGGCGGCCGA TACATTCCGC GCCAATCCGG CCTTCGATTG CGCCACCGTC 
ATCACCAATC TCGGCACCGG CGAGGCGCTG GTCTCGACGC TGGAGGCCAA GGGCGCGCCT 
TCGATCGTCG AGCGCACGCT GATCCGCCCA CCCTCCGGTC GCGTCGGCCC GGTGACCGAT 
GACGAGCGCC GTCAGATCAT GGACAGGAGC CCGGTTCTCG GCGTCTATGA CGAGGATATC 
GACCGCGAAT CCGCCTTCGA ACTGCTGGCC GCACGGGCGA AGAAGGCAGC CGATGCCGAA 
GCCGCCAAAC GGGCGCAGGA AGAAGCGCCT CAGCAACAGG GCGGCACAAC CTCCGGCTGG 
AACCTGCCGG GCTTCGGCGG CGGCAATGAC GACGACAACC AGGGCCGCGG CCAATCGCGC 
GGCCGGACGT CCAGCTATCA GCGCGAAACG GTGGTGGAAG CGGCAATGAA GAGCGTGGCC 
CGCACGGTGG CAACACAAGT CGGCCGGGCG CTGGTGCGCG GGATCTTGGG GAGCTTGAAG 
CGGTAG

Protein sequence

MIEDGKIFIG ASRNPDDSIN KPEYLDLKFG NRHGLVTGAT GTGKTVTLQV LAEGFSRAGV 
PVFAADIKGD LSGIAAKGEP KDFLTKRAEQ IGFTDYEFDQ FPVIFWDLFG EKGHRVRTTI 
AEMGPLLLAR LMDASEPQEG VINIAFKIAD QGGLPLLDLK DFSSLLNYMG ENASQLSNQY 
GLISKASVGS IQRALLVLEQ QGAEHFFGEP ALKISDIMRT SNNGYGQISV LAADKLMMNP 
RLYATFLLWL LSELFEELPE VGDPDKPKLV FFFDEAHLLF NDAPKVLTER VEQVVRLIRS 
KGVGVYFVTQ NPLDVPETVL AQLGNRAQHA LRAYSPREQK AVRTAADTFR ANPAFDCATV 
ITNLGTGEAL VSTLEAKGAP SIVERTLIRP PSGRVGPVTD DERRQIMDRS PVLGVYDEDI 
DRESAFELLA ARAKKAADAE AAKRAQEEAP QQQGGTTSGW NLPGFGGGND DDNQGRGQSR 
GRTSSYQRET VVEAAMKSVA RTVATQVGRA LVRGILGSLK R