Gene Rleg_0440 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_0440
Symbol
ID	8011640
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	455861
End bp	456889
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	54%
IMG OID	644823034
Product	N-acylneuraminate-9-phosphate synthase
Protein accession	YP_002974288
Protein GI	241203192
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2089] Sialic acid synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTCGCA AAGATGTTCT CGATGAATCG CCCTTCGTGA TTGCCGAAGT GGGCCAAAAT 
CATCAGGGAG ACCTGGATAT CGCCCGAGAA TATATCCGAA TTTATGCATT CGAAGGCGCG 
GATGCGATCA AGTTTCAGAC GCGCAACAAT AGGTACCTTT TTTCGGAGGA TGCTTATGCG 
GCGGGGTATG ACAGCGAAAA TGCTTTTGCA GAAACCTACG GCGCTCATCG AGAGAAGCTC 
GAGCTAAAAC CGGAATGGCT GCCCATTCTG AAGGCTGATT GCGAAAAGCA CGGCGTGAAG 
TTCATGTCGA CACCCTTCGA CGAGCCAAGC CTCGAGATCC TCCAGCAGAT TGATGTCGAC 
CTGTTGAAAG TGGCTTCGTT CGATCTTGGC AACCTTCCCT TCCTCAATCG GATCGCGAAA 
CTCGGTAAGC CCGTTGTCAT GAGCATTGGC GGCGGCAAGA TCGAACAGAT CCGGTCCAGC 
GTCGAGGTGG TGTTGAGGCA TCACGATCAG TTGGCCATCC TGCACTGCGT CTCCGAATAT 
CCGTGCGAGT ACAACCGCCT TGGGCTGGAC AATATTGAGG TTCTCATCAA GGAGTTTCCG 
GATTGTATCA TCGGCTCGTC CGATCACTTC AACGGGACCT TGTCAGGCCC GATTGCCTAC 
ATGAAGGGCG CGCGCGTGTT CGAAAAGCAC GTTACCCTCA ACCGCGCCTG GAAGGGCACC 
GACCATAGCT TTGCACTGGA GCCTGACGGC TTCCGCAAGT TCGTGCGTGA CATCAAGCGC 
GTCCGCGCGA TGATGCCTCA GAAGCCGGCG GACGAGATCG GCAACGAAAG AGTGTTCAAG 
AAGCTGGGCA AGTCGATCAT CGCATATTCG GACATCCGCG TCGGCGAAGA GCTGACCCTG 
GATAAGCTTT CGGGTCGCAT TTTCAATACC CATTACATAC CTGTGCGGGA GAGCAATAAG 
GTTCTCGGAA AGACGGTGAA GCGGGATATT GCAAAGGGTG AACCCATTCA ATACTCCGAT 
TTCGGCTGA

Protein sequence

MFRKDVLDES PFVIAEVGQN HQGDLDIARE YIRIYAFEGA DAIKFQTRNN RYLFSEDAYA 
AGYDSENAFA ETYGAHREKL ELKPEWLPIL KADCEKHGVK FMSTPFDEPS LEILQQIDVD 
LLKVASFDLG NLPFLNRIAK LGKPVVMSIG GGKIEQIRSS VEVVLRHHDQ LAILHCVSEY 
PCEYNRLGLD NIEVLIKEFP DCIIGSSDHF NGTLSGPIAY MKGARVFEKH VTLNRAWKGT 
DHSFALEPDG FRKFVRDIKR VRAMMPQKPA DEIGNERVFK KLGKSIIAYS DIRVGEELTL 
DKLSGRIFNT HYIPVRESNK VLGKTVKRDI AKGEPIQYSD FG