Gene Plim_1742 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_1742
Symbol
ID	9138443
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	2263322
End bp	2265175
Gene Length	1854 bp
Protein Length	617 aa
Translation table	11
GC content	59%
IMG OID
Product	thiamine biosynthesis protein ThiC
Protein accession	YP_003629771
Protein GI	296121993
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.780857
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCAACA TCGCGCATTC GAACTCGATG GAACTTCCTC CACTGGGCAA TAACCCTTCC 
ACTCATCATG CCGGTACAAC GCCAGGCAGC TTCGCCAACC CCCCACGAGT CGCACCAGGT 
GTCGAAGGTC GTTGGACTTT TTCCTCGCCC GACACACCGA ACATGCCGCA GCCTTCTGAA 
AAGACGGCTT GGGATTTCCT CCCGGAGGGT TGGTCAACGG TGGAACTCGA AGAGGCAGCC 
GAACTCTTCG ATTACACATC GGGTGCCACG CGGGTTGTCT TTCTGCAAAG TGACGACAGC 
CAGCGTAAAG TCTGTTTGCC CGCCGGCTTC GAACCCTCGA CACAGCTTGA ATGGGCTCGT 
GTGGGTGTGA TCACCCCGCA GATGGTGCGA GTTGCTGAAC GTGAAGATCA TCTCATGCCT 
GCCCAGGTTC GTGACGAGAT CGCCGCTGGC CGGTTGGTGA TTCCCGCCAA CAAGCACCAC 
CTCAAATACC AGCTCGATCC CATGGCCATT GGCCGGGCGA CGAAGACCAA GATCAATGCC 
AACATGGGGG CCTCCCCCGT CTCCTCCAGC ACCGACGAGG AAGTCGAAAA GCTGAAGTGG 
GCCGAACGCT GGGGTGCGGA TACGGTGATG GATCTTTCCA CCGGTGGCGA CCTCAACGCC 
TGCCGCGTGG CGATCGTGCA GAACAGCACG GTCCCCATCG GGACGGTTCC CATCTATTCA 
ATGATTATTG GGCGAAAGAT TGAAGAGCTC TCGCACGAGA TCATCCTTGA AAGTCTCGAA 
CAACAGGCCC AACAAGGGGT CGATTACTTC ACGATCCATG CCGGTGTCTT GCGGGAACAT 
CTTCCATTTG TGGTCAAGCG GCTCATCGGG ATTGTCAGCC GGGGTGGTTC GCTCCTCGCC 
CAGTGGATGA TCCGCAACAG CGGCCAGAAT CCGATGTACG ATCGCTGGGA AGACATCTGC 
GACATCATGC GCAAGCACGA TGTCACCTTC TCGATCGGCG ACGGCCTGCG TCCCGGCGGA 
TTGGCCGATG CCACCGACCG CGCTCAACTC GCCGAACTGG CGACATTGGG TGAATTGACC 
GAGCGCGCCT GGCGGAAGGG CGTGCAAGTC ATGATCGAAG GGCCAGGCCA CGTCCCTTTC 
GACCAGATCG AATACAACAT GAAGCTCCAG CGGACGCTCT GCCACGGTGC CCCGTTCTAT 
GTCCTTGGGC CGCTGGTGAC AGATATCTTC CCCGGCTATG ACCATATCAC CAGTTGTATT 
GGTGCGACTG CCGCTGCCTA TCACGGCGCG AGCATGCTCT GCTATGTGAC CCCCAAGGAG 
CACCTGGGCC TGCCCAAGAA AGACGACGTC AAGCAGGGCT GCATTGCCTA TAAGATTGCG 
GCTCATGCGG CCGATGTGGC CCTCGGCATT CCCGGCACTC GCGACCGCGA CGACGAACTG 
ACCAAGGCTC GCGCTGCCCT CAACTGGGAG AAGCACTTCG AGCTGAGCTT CGACCCCGAT 
ACGGCCCGTG CCTATCACGA CGAGGACCTC GACGTCGACA CCGACTTCTG CGCCATGTGT 
GGCCACGACT GGTGCAGCGT CCGCATCTCG AAGGAGATCG TCGAATTTGC TTCAGGTAAG 
GACGAGAACT ACCAGTGGAA CCGCGCCAAG GTTTCTGCTG CTCTCACGCC CGAGCAGCAG 
GAAATCCTCG AAAAGCGCGG TCACCTCTCC CCGCAGGAGA TCCATCAACT CGCCAGCAAG 
ACCAAAAAGG TCGTTGGTGC CAATAAAGAC GCCAAAGCGG CCTGCCACAG CGACGTGGTC 
GATGCAGAAA GTGCTAAGCA AATCCAGGTC GAACGACTGA GTTCGGCAAC GTGA

Protein sequence

MINIAHSNSM ELPPLGNNPS THHAGTTPGS FANPPRVAPG VEGRWTFSSP DTPNMPQPSE 
KTAWDFLPEG WSTVELEEAA ELFDYTSGAT RVVFLQSDDS QRKVCLPAGF EPSTQLEWAR 
VGVITPQMVR VAEREDHLMP AQVRDEIAAG RLVIPANKHH LKYQLDPMAI GRATKTKINA 
NMGASPVSSS TDEEVEKLKW AERWGADTVM DLSTGGDLNA CRVAIVQNST VPIGTVPIYS 
MIIGRKIEEL SHEIILESLE QQAQQGVDYF TIHAGVLREH LPFVVKRLIG IVSRGGSLLA 
QWMIRNSGQN PMYDRWEDIC DIMRKHDVTF SIGDGLRPGG LADATDRAQL AELATLGELT 
ERAWRKGVQV MIEGPGHVPF DQIEYNMKLQ RTLCHGAPFY VLGPLVTDIF PGYDHITSCI 
GATAAAYHGA SMLCYVTPKE HLGLPKKDDV KQGCIAYKIA AHAADVALGI PGTRDRDDEL 
TKARAALNWE KHFELSFDPD TARAYHDEDL DVDTDFCAMC GHDWCSVRIS KEIVEFASGK 
DENYQWNRAK VSAALTPEQQ EILEKRGHLS PQEIHQLASK TKKVVGANKD AKAACHSDVV 
DAESAKQIQV ERLSSAT