Gene Smed_5907 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5907
Symbol
ID	5320209
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	872130
End bp	873632
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	64%
IMG OID	640777602
Product	hypothetical protein
Protein accession	YP_001314534
Protein GI	150377939
COG category	[S] Function unknown
COG ID	[COG3333] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.586249
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.273775
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACACCC TCAATGCGCT TCTCGGCGGC TTCGGCTCCG CGCTCTCTCC GATGAACCTG 
CTATGGGCGC TCCTCGGCGT CACGCTCGGC ACGTTCATCG GCGTATTGCC GGGTCTTGGT 
CCCGCGCTGA CCATCGCACT TCTGCTGCCC ATAACCTTCC AGGTCGATCC GGCCGCGGCG 
TTCATCGTCT TCGGCGGCAT CTATTTCGGC TCGCAGTTCG GCGGCTCGAC GACCTCGATC 
CTCATCAACA CGCCCGGTGA AAGCGCCTCG ATCGTGACCG CGCTGGAAGG CAACCGAATG 
GCCCGTAACG GCCGCGGCGC GCCAGCCCTT GCGACTGCTG CGATCGGCTC CTTTGTCGCC 
GGCACGATCG GCGTCGTCTG TCTGAGCCTC CTCGCGCCCG TGGTCGTCAA GCTGGCGCTC 
GCCTTCGCGC CGGCAGACTA TTTCGCGCTG ATGGTTCTGT CCTTCGTCAC CGTCGCCGCC 
GTGCTGGGCA ATTCCGTCAT ACGAGGACTT ACCAGTCTCA GCCTCGGCCT CCTGCTCGGC 
CTCGTCGGTG TGGATCTGCA ATCAGGCCAG GCCCGCTTCA CATTCGGCGC GCTCGACCTG 
CTGGACGGCA TCGACGTGAT CATCGTCGTC GTCGGACTTT TTGCGGTCGG CGAGACGCTG 
CATCTCGCCA CCCGCTACCG CTCCTCCCCG GAAGAGATCA TTCCGGTGAA GGGCTCCATG 
TGGATGACGG CGCAGGACTG GGCACGCTCC TGGAAAGCCT GGATCCGCGG CGCGCTGATC 
GGCTTTCCCA TCGGTGCGAT GCCCGCAGGG GGGGCCGAGA TTCCGACCTT TCTCTCCTAT 
TTCGTCGAAA AGAAGCTCTC GAAACATCCG GAAGAATTCG GCCATGGGGC GATTGAGGGC 
GTCGCCGGTC CGGAAGCCGC GAACAATGCG GCGGGAGCCG GCGTCTTCGT GCCGCTGCTG 
ACGCTCGGCA TTCCGACCTC GGCGACGGCC GCCGTCATGC TGTCGGCCTT CCAGAGCTAT 
GGCATCAACC CCGGTCCGCA ACTCCTGACC AGCCACGCCG ATCTCGTATG GACGCTGATC 
GCCAGCCTCT ATATCGGCAA CGTGATGCTG CTTATCCTGA ACCTGCCGCT CGTCGGGCTC 
TGGGTGCAGA TCCTTCGCAT TCCGACGCCC TATCTTTATG GCGGCATCCT GCTCTTCGCG 
ACCGTAGGCA CCTACGGCAT CAGCCGTTCG GTCTTCGACC TCGTCATGCT CTATGCCATC 
GGGCTGGCCG GCTTCTTCAT GCGGCGCTAC GATTTTCCGA CCAGCCCCGT GATCATCGGC 
ATGATCCTCG GACCCCTCGC CGAGCAGCAG TTCCGCCGGG CCATGACCAT GTCGCAGGGG 
GATCTCTCGG TCTTCGTCGC AAGGCCGATT TCAGCAAGCT TGCTTGTACT CGCCTTCATC 
GCCCTCACGG CACCCATCGT CCTGTCCTTC CTCCGCAGCC GCCGGGAAAC GGCTGCCGCC 
TGA

Protein sequence

MDTLNALLGG FGSALSPMNL LWALLGVTLG TFIGVLPGLG PALTIALLLP ITFQVDPAAA 
FIVFGGIYFG SQFGGSTTSI LINTPGESAS IVTALEGNRM ARNGRGAPAL ATAAIGSFVA 
GTIGVVCLSL LAPVVVKLAL AFAPADYFAL MVLSFVTVAA VLGNSVIRGL TSLSLGLLLG 
LVGVDLQSGQ ARFTFGALDL LDGIDVIIVV VGLFAVGETL HLATRYRSSP EEIIPVKGSM 
WMTAQDWARS WKAWIRGALI GFPIGAMPAG GAEIPTFLSY FVEKKLSKHP EEFGHGAIEG 
VAGPEAANNA AGAGVFVPLL TLGIPTSATA AVMLSAFQSY GINPGPQLLT SHADLVWTLI 
ASLYIGNVML LILNLPLVGL WVQILRIPTP YLYGGILLFA TVGTYGISRS VFDLVMLYAI 
GLAGFFMRRY DFPTSPVIIG MILGPLAEQQ FRRAMTMSQG DLSVFVARPI SASLLVLAFI 
ALTAPIVLSF LRSRRETAAA