Gene Smed_1858 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1858
Symbol
ID	5322716
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	1931196
End bp	1932197
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	66%
IMG OID	640790796
Product	import inner membrane translocase subunit Tim44
Protein accession	YP_001327528
Protein GI	150397061
COG category	[S] Function unknown
COG ID	[COG4395] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.767036
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.41098
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCGTT TCGGACGGGT TCTGGCCATT GCGGCGATTG GTGTTGCGGC GATGTTGACG 
GTGGTCGATG TCGCCGATGC GAGACGGGCA GGCGGAGGAT TCGGTTCTCG CGGCAGCCGG 
ACATTTTCCG CGCCGCCGGC GACGCGCACG GCGCCCGCGC CCGCCGCGCC GATCGACAGG 
ACGATGACGC CGCGGCAGAA TGCGCAGCCT TCGACCGCAA CGAGCCCGGC TACCCAGAAC 
CGGACGGGCA ATGCGCGCCC GGGCTTCTTC AGCGGATTCG GCGGATCGAT GATCGGCGGC 
CTCATGATGG GCGGTCTGAT CGGCATGCTG CTCGGTCACG GTATCGGCGG CGGCGTCGGC 
TTCCTTGGAT TGCTGCTGCA AGTTGGTCTC GTCGTTCTGC TCATTTCCCT TGCAATGCGG 
TTTTTCGGCC GCAACCAGCG CCCGGCCTAT TCGGCGCCGT CGGCAACCGC CCGCACATCG 
GCGACGGCCG GTAATCCGCC ATCCTTCCGC ATCCCAAGAA TAGGGGAAGC CGTGGGCAGT 
GCCGCCGCGC CGCGTTCGCC TGCTGCGGCA CCGGCTTATG GCGGTGGAGA GGAAATCAGT 
GTCGGCCAGG ACGATCTCGA TCGTTTCGAG ACGATGCTGA AGGGCGTGCA GGCTGCCTAC 
GGAGCAGAAG ATTATGCGGC GTTGCGGAGG CTGACCACAC CGGAGGCCAT GTCCTACCTT 
GCAGAAGAGC TCAGCGACAA TGCAACGAAG GGCCTCAAGA ACGAAGTCCG GGACGTTCAC 
CTCGTCCAGG GCGACCTGGC CGAGGCATGG AGAGGAGACG GCAGGGATTA CGCAACCGTT 
GCGATGCGCT ACGAGAGCGT CGACGTGATG CGCGACAGGG CGACCGGCGA CGTGGTCAGC 
GGCGACGCGG ACAGGCCGAC CGAGGCAGTC GAGATATGGA CCTTTGTGCG CAGGCCCGGC 
GCCGATTGGC AGGTATCGGC CATCCAGGGC GTCGAGGCTT GA

Protein sequence

MQRFGRVLAI AAIGVAAMLT VVDVADARRA GGGFGSRGSR TFSAPPATRT APAPAAPIDR 
TMTPRQNAQP STATSPATQN RTGNARPGFF SGFGGSMIGG LMMGGLIGML LGHGIGGGVG 
FLGLLLQVGL VVLLISLAMR FFGRNQRPAY SAPSATARTS ATAGNPPSFR IPRIGEAVGS 
AAAPRSPAAA PAYGGGEEIS VGQDDLDRFE TMLKGVQAAY GAEDYAALRR LTTPEAMSYL 
AEELSDNATK GLKNEVRDVH LVQGDLAEAW RGDGRDYATV AMRYESVDVM RDRATGDVVS 
GDADRPTEAV EIWTFVRRPG ADWQVSAIQG VEA