Gene Smed_4226 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4226
Symbol
ID	5319300
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	708535
End bp	710073
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	63%
IMG OID	640776031
Product	hypothetical protein
Protein accession	YP_001312964
Protein GI	150376368
COG category	[S] Function unknown
COG ID	[COG3333] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0723732
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAATA TCGGTCTCCT GATCGATGGC TTCGGCCACA TCCTCAGCTG GAACCATATC 
CTGCTGATGG TCGTCGGCGT GACGCTCGGC ATCCTCGTCG GGGTGCTGCC GGGGCTCGGG 
GCGCCAAACG GCGTGTCGCT GCTCCTGCCG CTCACCTTCT CCATGGACCC CATCTCGGCG 
ATCATCCTCT TGTCCTGCAT GTATTGGGGC GCGCTCTTTG GCGGCTCGAC GACGTCGATC 
CTCTTCAACA TTCCGGGCGA GCCCTCATCC GTCGCGACCA CATTCGACGG CTATCCAATG 
GCGAAAGCCG GTCATGCGAG CCGGGCGCTC ACACTCGCCT TCGTTTCTGC CGGCCTCGGC 
GCGCTTGCCG GGGTCGTCAT GATCACGCTG CTTTCGGGCT GGGTGGCGAA CTTCGCACTC 
AAATTCTCCT CGCCGGAATA TTTTGCCGTT TATTTTCTCG CCTTTGCGAG CTTCATCTCA 
ATGGGCGCGC AGTCGCCTTT CAAGACGCTC GTGTCGATGA TGCTCGGCTT CGCTCTCGCC 
TCCGTCGGCA TGGATACGAT CTCGGGCAAT CTGAGGCTCA CCTTCGACAT TCCCGAACTG 
ATCAAGGGCG TCAGCTTCCT CATCGCCGTC ATGGGACTCT TCGGTATCGG CGAACTTCTG 
CTGACGACGG AAGAGGGGCT GCGCTTCGAA GGCATCAAGG CGCGGGTGCG GCTGTCCGAA 
ATCGGCAGGA CGCTGATCGA GATCCCACGC TATTGGCTGA CGATCGCCCG CTCGACGATT 
ATCGGCATCT GGATGGGGAT CACGCCGGCC GGCCCGACCG CCGCCTCCTT CATGAGCTAT 
GGCGTTGCCC GGCGCTCGGC GCGCGACAAT TCGATGTTCG GCAAGGGCGA TCCGCGCGGC 
ATCGTCGCGC CCGAGACGGC CGACCATTCC GCCGGCACTT CGGCCCTGCT GCCGATGCTG 
GCGCTCGGCG TCCCGGGTTC CGCCACCGCC GCGGTGATGA TGGGCGGGTT GATGATCTGG 
GGCCTGACGC CCGGTCCGAT GCTCTTCACC GATCGCCCCG ACTTCGTCTG GGGCCTGATC 
GCCTCCATGT ATCTCGGCAA TGTCGTCGCT GTCTTTCTCG TGATCGCGAC GGTGCCGCTT 
TACGCCTCCA TCCTGCGTGT GCCGTTCTCC ATCATCGGAC CGATCATCGT CGCGGTCATC 
TTCTCAGGAG CTTACCAGGT CGCAAACTCC GTTTCGGACA TCTTCATGGT GATCGGCTTC 
GGTCTTCTCG GCTACGTCTT CAAAAAGCTC GACTATCCGC TGGCGCCGCT GGTCCTCGCC 
ATGGTGCTCG GTGACAAGGC AGAAGACGCC TTCCGCCAGT CGATGCTGAT GTCGGGCGGC 
AGCCTGAACA TCTTCTGGTC GAATGGCCTT GTCTCCGCCC TGATGGCGGT TGCCCTTGCG 
CTGCTTCTTT CGCCGCTCGC CTTCTTGCTG ATCGGCAGCG TGCGAAAACG CAAGAACGAG 
GTGGTGGCGC CCGGCGGTGA CGGCAGTCCG GCAGGCTGA

Protein sequence

MENIGLLIDG FGHILSWNHI LLMVVGVTLG ILVGVLPGLG APNGVSLLLP LTFSMDPISA 
IILLSCMYWG ALFGGSTTSI LFNIPGEPSS VATTFDGYPM AKAGHASRAL TLAFVSAGLG 
ALAGVVMITL LSGWVANFAL KFSSPEYFAV YFLAFASFIS MGAQSPFKTL VSMMLGFALA 
SVGMDTISGN LRLTFDIPEL IKGVSFLIAV MGLFGIGELL LTTEEGLRFE GIKARVRLSE 
IGRTLIEIPR YWLTIARSTI IGIWMGITPA GPTAASFMSY GVARRSARDN SMFGKGDPRG 
IVAPETADHS AGTSALLPML ALGVPGSATA AVMMGGLMIW GLTPGPMLFT DRPDFVWGLI 
ASMYLGNVVA VFLVIATVPL YASILRVPFS IIGPIIVAVI FSGAYQVANS VSDIFMVIGF 
GLLGYVFKKL DYPLAPLVLA MVLGDKAEDA FRQSMLMSGG SLNIFWSNGL VSALMAVALA 
LLLSPLAFLL IGSVRKRKNE VVAPGGDGSP AG