Gene Smed_1029 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1029
Symbol
ID	5321875
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	1099550
End bp	1101091
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	57%
IMG OID	640789972
Product	SpoVR family protein
Protein accession	YP_001326717
Protein GI	150396250
COG category	[S] Function unknown
COG ID	[COG2719] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.06645
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCACCG CCTCGAACCT TCTGTTCCAA AGTTCCGACT GGAATTTCGA AACGCTGGCG 
CACACCTATG ATGCCATCGA GGAGATCGCG CTGGGCGATC TCGGTCTCGA CGTTTACCCC 
AATCAGCTCG AGATCATCTC CTCCGAGCAG ATGCTGGATG CCTATTCGTC CGTGGGCATG 
CCGCTCATGT ACCAGCATTG GTCCTTTGGA AAGCGCTTCG TCTTCGAGGA CCATCTCTAT 
CGCAGAGGGC GGCGGGGGCT GGCTTACGAG CTGGTGATCA ACTCCAATCC CTGCATCACC 
TATCTGATGG AGGAGAACAC CATGGCCATG CAGGCCCTGG TGACCGCACA TGCCGCCTTC 
GGCCACAATC ATTTTTTCAA GAACAACTAT CTTTTCCGGC AGTGGACCGA CGCCACCGCA 
ATCCTCAGCT ATATGGACTT CGCCAAGAAA TACATTGCCA AATGCGAAGA ACGGCACGGA 
ACGCCGGCAG TGGAGGCGAT CCTCGACTCT GCGCATGCGC TCATGGAGCA GGGCGTCTTC 
CGCTACCGAC GGCCTCCGCG CCTGTCGTCC GAAAAAGAAC GGGAACGGAT GCGCGAGAGG 
CTGGAATATG AAGAGCAGAC CTATAGCGAC CTGTGGAGAA CACTTCCGCC ATCAGGGGAA 
AACAACGATC CGACGCAATT GGAAAAGGAA CTCGCGGAGC GGAAAAAATC ACTGAACCTT 
CCGGAAGAGA ACCTGCTCTA TTTCCTGGAA AAAACCAGCC TCATCCTTGA ACCATGGCAA 
CGCGAGATAC TGCGGATCGT CCGCGTGATC GCTCAGTACT TCTACCCGCA GCGGCAGACG 
AAGGTTATGA ACGAGGGATG CGCCACCTTC GTCCACTACA CCATCATGAA CAAGCTTTTC 
GACCAGGGAA AGATAAGCGA AGGTGCAATG CTGGAGATCC TCCAGAGCCA TACCAACGTC 
GTTTTTCAGC CCGGCTTCGA CGACCCCCGC TTTCCGGGAA TCAATCCGTA TGCGCTGGGA 
TTTGCCATGA TGCAGGATAT CGAGCGGATC TGCGTCGCGC CTACGGCAGA GGACCGCGAT 
TGGTTTCCCG ACATCGCCGG CACCGGCAAC TGGCGCGAAA CGCTCCTCGA CGCCTGGGCC 
AATCATCGCG ACGAATCCTT CATCCTGCAG TTCCTGAGCC CGGCGCTGAT CCGAAAGTTC 
AGGCTCTTCC TCTTGACGGA CGAAGCGGAC GACAACTTCT GCGAAGTGGC ATCCATCCAC 
AACGAGCGCG GCTACGAAGC GTTGCGCGGC GCACTCGCCC GCAGCTATGA CATCGGGGTC 
AACCAGCCCG ATATCCAGGT CATGGATGTC GATCTGCTCG GAGACCGCCA CCTGCGGCTG 
CAGCACAATG TGAAGGATGG AGTGCTGCTG GAGGAGAACA GCCGCGATTC CACTCTGCGC 
CACGTCCGCC ATCTCTGGGG ATACGAAGTG AGCTTAGCGG GGGTCGATGC GGAAACCGGC 
GAAACGCTCT ATGAGTGCTC GACAGAGGAG CTTTCAGACT AG

Protein sequence

MGTASNLLFQ SSDWNFETLA HTYDAIEEIA LGDLGLDVYP NQLEIISSEQ MLDAYSSVGM 
PLMYQHWSFG KRFVFEDHLY RRGRRGLAYE LVINSNPCIT YLMEENTMAM QALVTAHAAF 
GHNHFFKNNY LFRQWTDATA ILSYMDFAKK YIAKCEERHG TPAVEAILDS AHALMEQGVF 
RYRRPPRLSS EKERERMRER LEYEEQTYSD LWRTLPPSGE NNDPTQLEKE LAERKKSLNL 
PEENLLYFLE KTSLILEPWQ REILRIVRVI AQYFYPQRQT KVMNEGCATF VHYTIMNKLF 
DQGKISEGAM LEILQSHTNV VFQPGFDDPR FPGINPYALG FAMMQDIERI CVAPTAEDRD 
WFPDIAGTGN WRETLLDAWA NHRDESFILQ FLSPALIRKF RLFLLTDEAD DNFCEVASIH 
NERGYEALRG ALARSYDIGV NQPDIQVMDV DLLGDRHLRL QHNVKDGVLL EENSRDSTLR 
HVRHLWGYEV SLAGVDAETG ETLYECSTEE LSD