Gene Smed_5364 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5364
Symbol
ID	5319666
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	330875
End bp	332026
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	62%
IMG OID	640777136
Product	HPP family protein?
Protein accession	YP_001314068
Protein GI	150377473
COG category	[T] Signal transduction mechanisms
COG ID	[COG3448] CBS-domain-containing membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.344775
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.280172
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGTTC CGCCTCCACC CGATAATGTT CAGAAGCCAG GGTCTTCGCC CAGGTTTAAG 
CTGTTTTCCC CGATCCTGGC GGGCGCAACG CTGAAAGAGC GCCTTATCGG CTGTCTCGGA 
GCGCTGATCG GCATCTGTTT GACCGGTCTC GTCTGCGGGT TCATCTTCGG CGACGATCCT 
CAGCTGCCGT TGATCGTTGC CCCCATCGGC GCTTCTGCGG TCTTGCTCTT TGCGGTTCCG 
GCCAGTCCGC TTGCGCAGCC CTGGTCGATC ATCGGCGGGA ACACGATCTC CGCCCTGATC 
GGCGTCACCG TGAGCTATTT CGTGAAGGAC CAGATGGTCG CCATCGGCCT TGCGGTTGCC 
CTGGCGATCC TTGCCATGTC GCTCACGCGG TCGCTTCACC CCCCTGGAGG CGCCGCCGCG 
CTGACAGCGG TGATAGGTGG AGCGGCGATC GCGCGCGCGG GTTTCTGGTT CCCGTTCATA 
CCGGTAGCCA TCAACTCCCT GATCCTTGTG GGATTGGGCA TCGTATTCCA CCGGATGGCG 
CGGCGCCAAT ATCCGCACCG ACCGGCTGTT GCACCAGTGA ACACGCATGA AACGGCCGAT 
CCCCCGCCTG CGCTTCGGGT CGGCTTCAAT TCCGAGGACA TTGATCTCGC AATAGCACGC 
TTGAACGAGA CACTCGACGT CAGCCGCGCG GACATCGATG CTCTCTTGAG GGAAGTCGAA 
CTGCAGGCCC TCATCAGACA GAGGGGAGAG CTGACATGTG CCGACATCAT GTCCCGCGAC 
GTCGTAACCG TTCCGGCCGA CACGACGCCG GACCATGCAC GATACCTCTT GTTGAAGCAT 
GATATTCGAA CACTTCCCGT GCTCGACGAA AACGGGAAAC TGCAAGGGAC GGTCGGCCTG 
CGAGAGCTGG CCGGCAAGGA ACCCGGCAGC AAACTGCCGA TCGCCGTGGC GGCCACCGCC 
AACCCGTCCG ACCCTGCGAT CAGCCTGCTC CCCCGCCTGA CGGACGGCAT GACACATGCC 
GTCGTCATAC TGGACGACGA CGAAAAGGTC GTGGGCATCA TATCCCAAAC CGACCTGCTC 
GCGACTTTGG CCAAAAGCAT CTCCCAGAAC GGTGCGTCCG AGATCATGCG AGGCCACGGA 
CAGGGCATCT AG

Protein sequence

MIVPPPPDNV QKPGSSPRFK LFSPILAGAT LKERLIGCLG ALIGICLTGL VCGFIFGDDP 
QLPLIVAPIG ASAVLLFAVP ASPLAQPWSI IGGNTISALI GVTVSYFVKD QMVAIGLAVA 
LAILAMSLTR SLHPPGGAAA LTAVIGGAAI ARAGFWFPFI PVAINSLILV GLGIVFHRMA 
RRQYPHRPAV APVNTHETAD PPPALRVGFN SEDIDLAIAR LNETLDVSRA DIDALLREVE 
LQALIRQRGE LTCADIMSRD VVTVPADTTP DHARYLLLKH DIRTLPVLDE NGKLQGTVGL 
RELAGKEPGS KLPIAVAATA NPSDPAISLL PRLTDGMTHA VVILDDDEKV VGIISQTDLL 
ATLAKSISQN GASEIMRGHG QGI