Gene Smed_5456 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5456
Symbol
ID	5319758
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	422750
End bp	423856
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	65%
IMG OID	640777218
Product	alanine racemase
Protein accession	YP_001314150
Protein GI	150377555
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000537083
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.747323
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGAGGAA ATTTCCCCGG GGCTCCGAAA AGCAAGGCGA CGATCGCGGA TGTTGCACGC 
ACAGCAGGCG TTTCCACGGC GACCGCGGGC CGCGTTCTTG GCGGCTACGG CTATACTAGC 
GAAAAGAAGA GGGAGCAGGT GCTCAAGGCC GCCCAGGATC TCGGCTACCG GCCTAATTCG 
CTCGCGCGCA GCCTCATCAC CGGCAAAACC CGCACGCTCG GCGTCGTTGC CGGCGATATC 
CAGAACCCGT TCTACGCCTC GGTGCTGCGC GGTATTTCCA ATGTCGCGGA GGCCAACGGC 
TTCGGCCTGC TGATCACCAA CAGCGACGAA ACACAGCTCA AAGAGGTTCA TTCGGTCGAG 
TTGTTGGCGC AGAAGCAGGT GGACGGACTG ATCGTCACCC CCAGCGACAC GCGCAAGGCG 
CGGCACCTGC ACAATCTGCG GACCGTGGGC GTCCCGCTCG TTCTTATCGA CCGTGCGGTC 
GCCGGCCTGA TGGTGGACCG CGTAGCAACA GACAACATCG CCGCCGCCGA ACATGCGGTA 
CGCCAGTTGA TTGCAGCCGG ACACCGCCGG ATCGCCATCG TGGCGGAACT CGTCGACGAA 
GGAAGCGGCG GGTTGGATAC ATTCCTCGCC CGCGCCGTGG CGGGCGATCC GATCGAGACC 
GATACGCTCT ATCCGAGCTG GCAGCGCCTC CTCGGCTATA TCCGGGCGCA TAGAATCGAG 
GGCCTGCCCG TCGACCAGCG CCTGATACTG CAAGCGGGCA GCTATTCCGC GCTCGCGGCG 
CAAGCGGTCG TCCCGCGCCT GATGATAGCG TCGGACCCGC CAACGGCGCT GTTCACCACG 
GACGGCACAA TGTCCGAAGG CGCCATGCGG GCGCTCACGG AGCTGAAGCT TTCGATCCCG 
CAGGATCTCT CTATCATCTG CTTCGACGAT CTCGACTGGA TGAGTTTCCA CCGCCCCGGC 
ATCACCACCG TGGCACAGCC GCGTCTCGCC ATGGGCGAAG CCGCCGCGCG GATGCTGCTT 
GAGCGCATTC GCGGCGAGGA CTATCCGCCT CGCACGGTGT TGATGCCCGC CGAACTGATC 
GAACGCGGCT CCGTCGCCCG GCTGTAA

Protein sequence

MRGNFPGAPK SKATIADVAR TAGVSTATAG RVLGGYGYTS EKKREQVLKA AQDLGYRPNS 
LARSLITGKT RTLGVVAGDI QNPFYASVLR GISNVAEANG FGLLITNSDE TQLKEVHSVE 
LLAQKQVDGL IVTPSDTRKA RHLHNLRTVG VPLVLIDRAV AGLMVDRVAT DNIAAAEHAV 
RQLIAAGHRR IAIVAELVDE GSGGLDTFLA RAVAGDPIET DTLYPSWQRL LGYIRAHRIE 
GLPVDQRLIL QAGSYSALAA QAVVPRLMIA SDPPTALFTT DGTMSEGAMR ALTELKLSIP 
QDLSIICFDD LDWMSFHRPG ITTVAQPRLA MGEAAARMLL ERIRGEDYPP RTVLMPAELI 
ERGSVARL