Gene Smed_4158 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4158
Symbol
ID	5319207
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	631356
End bp	632606
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	63%
IMG OID	640775963
Product	alanine racemase
Protein accession	YP_001312896
Protein GI	150376300
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.626127
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGGCGGC CGTACAATCG GCCTGCATTC TCCGCCGGAA GCGGAGAAAA ACACCCACTT 
CGAATTGTGG CGGGTCCCCT GCGGGGCCCG TCACTGCCGA GGGGCGGATT CGCAAAGATC 
TGCTTTCGCC GAATAATCAT AGGTCTCTTA GGGAAAACCT TTTCCCATAT TGACTTTGAG 
AGTGAGAAAA GGTTTTCTCA TCCCTGGTTC TCTCGGGAGG AGGCGAAACT GAGCTCTCAG 
CGCGGCAAGG GGCATCGCGT CACCATTCAC GATCTGGCGA GGGTCGCCGG CGTGAGTGTT 
TCGACCGTGT CGAAGGCACT CAACGACAAT GGCCGCATGG CCGCCGACAC GCGCGAGCGG 
ATCAAGACTC TTGCCGCGGA GATCGGCTTT CGTCCGAATG CGCTGGCGAA AGGGTTGCTC 
AGCAACCGGA GCTTCACCGT CGGTCTTCTG ACGAACGATA CCTATGGGCG CTTCACGCTT 
CCGGTCATGG CCGGAATATC CGAGGCGCTT GTGGATCATG GCGTGTCGGT CTTTCTTTGC 
GCCATCGAGG ATGACCCGGC CCTGGGAAAA ATCCATGTCG ACGCCATGCT GGACAAGCAG 
GTGGACGGCA TCATCGCGAC GGGCAAGCGG GTCGACAGGT CTCTCCCGGT CGACCTCGCT 
GGCCTGCCGG TGCCGGTCGT CTACGCCTTC ACCAAGGGCG AGCCGGGCAG CGTGACGCTG 
ACGTCGGATG ACCGGCACGG AGCGAGGCTT GCCACCGAGT GGCTGAAGGA GCTTGGCCGC 
CAGCGGCTTG TCCATATCAC CGGCCCGCGG GAATTCGTAT CCGCTGTGGA GCGCGCTGAG 
GCGTTCCGTA CCGTGGCTGG CAACGGCGCG CCGGTGCTGC ACGGCGTCTG GTCGGAGGCC 
TGGGGCCACG AAGCGATCGA CAGGATCTGG AAAGAGGGCG GCGAAAGGCC CGACGGCATC 
TTTTGCGGCA ACGACCAGAT CGCCCGCGGC GTGGTCGATG CGCTTCGCGA GCGCGGCGCC 
CGGGTGCCGG GGGATGTCTC GGTCATAGGT TTCGACAATT GGGAGATCAT GGCGGCACAG 
ACACGGCCGC CGCTGACGAC CATCGACACG AACCTGAAGG AACTTGGGCG CGAAGCGGGC 
CTGATGGTGC TTGCGCTTGC GGAGGGGCGG GCGATCGAAC CCGGTCTGCG CAGGTTGCCC 
TGCAAACTGG TCATAAGGGA CTCCTGCGGA GGCGGGCGCC GGCAGAACTG A

Protein sequence

MWRPYNRPAF SAGSGEKHPL RIVAGPLRGP SLPRGGFAKI CFRRIIIGLL GKTFSHIDFE 
SEKRFSHPWF SREEAKLSSQ RGKGHRVTIH DLARVAGVSV STVSKALNDN GRMAADTRER 
IKTLAAEIGF RPNALAKGLL SNRSFTVGLL TNDTYGRFTL PVMAGISEAL VDHGVSVFLC 
AIEDDPALGK IHVDAMLDKQ VDGIIATGKR VDRSLPVDLA GLPVPVVYAF TKGEPGSVTL 
TSDDRHGARL ATEWLKELGR QRLVHITGPR EFVSAVERAE AFRTVAGNGA PVLHGVWSEA 
WGHEAIDRIW KEGGERPDGI FCGNDQIARG VVDALRERGA RVPGDVSVIG FDNWEIMAAQ 
TRPPLTTIDT NLKELGREAG LMVLALAEGR AIEPGLRRLP CKLVIRDSCG GGRRQN