Gene Smed_5472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5472
Symbol
ID	5319774
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	441133
End bp	442053
Gene Length	921 bp
Protein Length	306 aa
Translation table	11
GC content	60%
IMG OID	640777233
Product	dihydrodipicolinate synthetase
Protein accession	YP_001314165
Protein GI	150377570
COG category	[E] Amino acid transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0329] Dihydrodipicolinate synthase/N-acetylneuraminate lyase
TIGRFAM ID	[TIGR00674] dihydrodipicolinate synthase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTGATT CCACTGGACT TCGCGGGATT CTTCCGGCGT TGGTGACCCC CGTCAAATCG 
GACGACACGA TCGACACCAA AGCGACCGAT GCGCTTTTCA ACTGGCTGCA GAGGCAAGGC 
GTCGACGGGG TCGTTCCGCT CGGCGGAACC GGCGAATACG GTGCGCTGTC GCGCGGTGAA 
CGCATCCGCT TTGTCGAGCT ATCGGCCAAG GCATTCGGTG GAAAGGTGCC CGTCGTTCCC 
GGAGTGCTCG ACCCCGGCTT CCACGACGCA ATGGAGTCCG CGCGCGATTT TGCTGCGGCA 
GGCGCCGACG CGTTGCTTGT TATTACGCCG TACTACACAA ACCCGACCCA GGCTGGCATT 
CGCGATTATT TTTTGCGCTA CGCGGATCAG TCTCCTGTGC CGATCCTGAT CTATGAAATT 
CCCTATCGGA CGAGGATCGC GATCGATCCC GAGGTTCTGC ACCAACTCTC CGCTCACGAG 
CGGATCATCG GTATGAAGGC ATGCAACACG GATATGTACC ACTACCTGCG GGTCATGGCA 
GGACTGGCGC CTTCCTTTTC CATGCTCAGC GGCGAAGATT CGCTGTTTCC GTTCCATGTT 
GCGGCTGGCG CCAAGGGCGG AATCGTAGTC ACTGCAAACC TGCTGCCGAA GGTATGGCGC 
CGGCTCTTCG ACCTCGCCGA AAGCGGCAAC GCGGCCGACG CCCTGGCGCT GCATCGTGAA 
TTGATTCCGT TCATGAACAT GGCGTTTGCC GAAACCAATC CAGGTCCGAT GAAGTCCGTG 
ATGGACCTGA TCGGCGTGGA TGCGCCTCAC ATGCTCGCAC CGCTGCGCCA GCCCGCATCC 
GAACTCCGGG ACGCGCTGCA CAAGGAATGT AGCCGCCTCC TCGAAAAGTA CGAACTGGAT 
AACACCAAGC TTGCATCGTA G

Protein sequence

MLDSTGLRGI LPALVTPVKS DDTIDTKATD ALFNWLQRQG VDGVVPLGGT GEYGALSRGE 
RIRFVELSAK AFGGKVPVVP GVLDPGFHDA MESARDFAAA GADALLVITP YYTNPTQAGI 
RDYFLRYADQ SPVPILIYEI PYRTRIAIDP EVLHQLSAHE RIIGMKACNT DMYHYLRVMA 
GLAPSFSMLS GEDSLFPFHV AAGAKGGIVV TANLLPKVWR RLFDLAESGN AADALALHRE 
LIPFMNMAFA ETNPGPMKSV MDLIGVDAPH MLAPLRQPAS ELRDALHKEC SRLLEKYELD 
NTKLAS