Gene Smed_1088 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1088
Symbol
ID	5321934
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	1155641
End bp	1156654
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	62%
IMG OID	640790029
Product	nifR3 family TIM-barrel protein
Protein accession	YP_001326774
Protein GI	150396307
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00737] putative TIM-barrel protein, nifR3 family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.267708
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATTTGC CATCCACGGC TCTTTCATCT TCGTTTCTGA TCGGGAATGT CCAAATCCGT 
AATCGCGTAG CGCTTGCGCC CATGTCCGGC GTGACGGATC TGCCCTTTCG CATGCTTGCC 
TGGCGCTTCG GCGCGGGCTT TGTCGTGACC GAGATGGTGG CGAGTCGCGA GCTGGTTGGC 
AATGCCGCCG AATCCTGGGC GCGGCTGAAG AATTCCGGCA TCGATCCGCA TATTGTCCAA 
CTTGCCGGGC GTGAGGCGCA TTGGATGGCC GAGGCGGCGA GGATCGTTGA GGCCAATGGT 
GCCGATATCA TCGATATCAA CATGGGCTGT CCCGCCAAGA AGGTTACCGG TGGCTATTCC 
GGATCTGCAC TCATGCGCGA CCCGGATCAC GCGCTGTCTC TGATCGAGGC GACGGTGAAA 
GCAGCGACGG TTCCGGTAAC GCTCAAGATG CGACTCGGTT GGGATGAGAA TTCGATCAAT 
GCGCCGCTGA TTGCCCGCAG AGCCGAGGAA GCCGGCGTGA AGGCGATCAC CATTCACGGG 
CGCACGCGCA TGCAGTTCTA CAACGGCAAG GCCGATTGGG ATGCGATCCG CTCGGTCCGC 
GAGGTGACTT CGGTCCCGCT GATCGCCAAT GGCGATGTTG ATTCCGTTGC GGATGCGCAT 
GAAATCCTGC GCCGCTCGGG TGCCGACGCC GTCATGGTCG GTCGATCTTG CCAGGGTCGG 
CCGTGGCATG CGGGCGTGCT CGCCGGCACG GCTGCCCATC CGGATGCGGC GGGCGTCGCA 
CGCATATTTG CGGAGCATTA CGAGACGCTC CTTGAATTCT ACGGCGTGGA GGTCGGCCTT 
CGCACTGCCC GAAAGCATGC CGGCTGGTAT CTCGATCGTT TCGCAACCGA GCTCCCCGTC 
TCGCAGAAGG CTGCGATCCT CACATCGACG GACACGGTTT TCGTGCGCGA CGGCGTTGCG 
GCCGCCATTG CCCGCTCCGG CGATGTGGCG GCGAGGGAGG AGATTGCGGC ATGA

Protein sequence

MHLPSTALSS SFLIGNVQIR NRVALAPMSG VTDLPFRMLA WRFGAGFVVT EMVASRELVG 
NAAESWARLK NSGIDPHIVQ LAGREAHWMA EAARIVEANG ADIIDINMGC PAKKVTGGYS 
GSALMRDPDH ALSLIEATVK AATVPVTLKM RLGWDENSIN APLIARRAEE AGVKAITIHG 
RTRMQFYNGK ADWDAIRSVR EVTSVPLIAN GDVDSVADAH EILRRSGADA VMVGRSCQGR 
PWHAGVLAGT AAHPDAAGVA RIFAEHYETL LEFYGVEVGL RTARKHAGWY LDRFATELPV 
SQKAAILTST DTVFVRDGVA AAIARSGDVA AREEIAA