Gene Smed_3108 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3108
Symbol	thiP
ID	5323987
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	3253909
End bp	3255504
Gene Length	1596 bp
Protein Length	531 aa
Translation table	11
GC content	65%
IMG OID	640792058
Product	thiamine transporter membrane protein
Protein accession	YP_001328769
Protein GI	150398302
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1178] ABC-type Fe3+ transport system, permease component
TIGRFAM ID	[TIGR01253] thiamine ABC transporter, permease protein

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGCCG GGGGTTTCGC CCTTGGCGGC GTTCTGCTTT TCATCGGCCT CGCAGCCGGG 
TCGCTGCTCG CCCAATCGAC CGGCGGCAAC GATGCCGGTC CGTTCCTTGA CGCCTATATC 
TGGCGCATAA CACGCTTCAC ACTGCTGCAG GCAGGCCTTT CCACGCTCTT TTCCGTGCTG 
CTCGCCATAC CGGTGGCCCG CGCACTTGCC CGCCAGGCTT CGTTCCCCGG CCGCATCTGG 
ATGTTGCGGC TGCTGGCGCT GCCTCTCGGC CTTCCGGCCC TCGTCGGCGC TCTCGGCCTC 
ATTGAGATCT GGGGACGACA GGGGCTTTTG AACAGGGTGC TCGCGGCGGC CGGGCTGGAG 
CAACCGGTCA GCATCTATGG GCTCTCCGGC ATTCTCATCG CCCATGTCTT TTTCAACATG 
CCGCTCGCCG CCCGTCTGAT GCTTGCCGGC ATCGAGCGCA TTCCGGCCGA GTATTGGCGC 
ACCTCCGCCA ATCTCGGCAT GAGCGCCTTC GCCATCTTCC GCTTCATCGA GTGGCCGGTG 
ATCCGCGGAT TGCTTCCCGG CATCGCCGGA CTCGTCTTCA TGCTCTGCGC GACCAGCTTC 
ACACTCGTGC TGACGCTTGG TGGCGGTCCG GCCGCCAGCA CCATCGAAGT GGCCATCTAT 
CAGGCGCTGC GCTTCGATTT CGACCCGCCG CGAGCGATCG CCCTGGCGGC ACTTCAGGTC 
GCCCTTACAG GTGCGCTGCT TCTCGTCCTG AAATTGATCG CGCCGCCGCC GCCGGAGGGT 
GAGACGAGCG GCAAGTCGAT CCGGCGTTCC GACGGTGCAA GCAGTCTTTC CCGGCTTGCC 
GACCGGGTTT GGCTGGTCCT CGCCGCCGGC CTGGTAGGCC TGCCGTTTGC AGCCATCGCC 
TATGCCGGTT CGAAGGCTGA TCTGTTCCGG CTTCTGAGCG AGCCGGTGTT CCATCGGGCG 
CTCGCGATGA GCGCGACCAT CTCGGTACTC TCCGCCGTCA TTTCGGTCGC TGTGACGGCG 
CTGATGATCC GCACCGAAAG TCTCGCACTG GCGCAGCGGC GCCCCGGAAT GACGGCACGT 
TTTTTCGCCG GCGCTATCGG TGCGAGCACA TCCTTTATCC TGCTGATACC ACCCGTCGTG 
CTCGGCGCCG GGTGGTTCCT GCTGTTGAGG CCTTTCGGCG ACGTCGCCCG CTTCGCCCCT 
GCCGTCGTCG TCGCCATCAA CGCGCTCATG GCGCTTCCCT TCGTTCACCG GGTGCTCGCA 
CCCGCCATGG CGACGCACGC CGTGCGCACC GGTCGCCTTG CCGCAAGCCT TGGAATCGCC 
GGCTTTCAAC GCCTGCTATG GATCGACTGG CCTGGCCTGC GCAAACCCCT TTTCGTCGCA 
TTCTCCTTTG CCATGGCCCT GTCCCTGGGG GATCTGGGAG CGGTCGCACT TTTCGGCTCG 
CAGGACATGG TAACCCTCCC TTATCTGCTC TATAGCCGGA TGGGCAGCTA TCGCACCGCC 
GATGCGGCCG GGCTCGCGCT GTTCCTAGGC CTCCTCTGCC TGGTCCTGAC GGTGCTCGGC 
ACGGCGGGAG AAGAGCCTGA AGGTAAAGGC GCATGA

Protein sequence

MAAGGFALGG VLLFIGLAAG SLLAQSTGGN DAGPFLDAYI WRITRFTLLQ AGLSTLFSVL 
LAIPVARALA RQASFPGRIW MLRLLALPLG LPALVGALGL IEIWGRQGLL NRVLAAAGLE 
QPVSIYGLSG ILIAHVFFNM PLAARLMLAG IERIPAEYWR TSANLGMSAF AIFRFIEWPV 
IRGLLPGIAG LVFMLCATSF TLVLTLGGGP AASTIEVAIY QALRFDFDPP RAIALAALQV 
ALTGALLLVL KLIAPPPPEG ETSGKSIRRS DGASSLSRLA DRVWLVLAAG LVGLPFAAIA 
YAGSKADLFR LLSEPVFHRA LAMSATISVL SAVISVAVTA LMIRTESLAL AQRRPGMTAR 
FFAGAIGAST SFILLIPPVV LGAGWFLLLR PFGDVARFAP AVVVAINALM ALPFVHRVLA 
PAMATHAVRT GRLAASLGIA GFQRLLWIDW PGLRKPLFVA FSFAMALSLG DLGAVALFGS 
QDMVTLPYLL YSRMGSYRTA DAAGLALFLG LLCLVLTVLG TAGEEPEGKG A