Gene Sde_0369 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_0369
Symbol
ID	3967616
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	+
Start bp	456219
End bp	458135
Gene Length	1917 bp
Protein Length	638 aa
Translation table	11
GC content	50%
IMG OID	637919432
Product	thiamine biosynthesis protein ThiC
Protein accession	YP_525845
Protein GI	90020018
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0422] Thiamine biosynthesis protein ThiC
TIGRFAM ID	[TIGR00190] thiamine biosynthesis protein ThiC

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAACCG ATACATTAGA AAAACCACGC TTGAGTGATA CCGCACAGGT AGACAGTCAA 
TCCATTGCGC CGTTTCCAAA TTCTAAAAAG ATCTACGTGC AGGGTAGTCG CCCAGATATT 
CGCGTACCTA TGCGCGAAAT TAATTTATCT ATAACGCCAA CGGAATTTGG TGGCGAACAG 
AATCCACCCG TGCGTGTTTA CGACACTTCT GGTGTGTACA CCGACCCCAA TGTAAAAATA 
GATGTGCGCC AAGGTTTGCC CGATGTGCGC AGCGCTTGGA TAGCCGAGCG CGGTGACACC 
GAAGTGCTGC AACAAAAAAG TTCGTCTTTT ACCCAGCAGC GCTTACACGA TGCAAGCTTG 
GATACCTTGC GTTTTAATCA CCAGCGCCAG CCCCTTAAAG CCAAGCCGCG CGCAAACGTA 
ACGCAAATGC ACTACGCGCG CTGCGGCATT ATTACCCCAG AAATGGAATA TATTGCCATT 
CGCGAAAATA TGAGCTGGCA GCAAGCCAAA GAGCAAGGCG TGTTAGATCA GCAGCATGCC 
GGCGAGCATT TTGGCGCAAA CATCCCAGAT GAAATTACAC CAGAATTTGT GCGCTCTGAA 
GTGGCCTGCG GCCGCGCAAT TATTCCTGCA AATATTAACC ACCCCGAACT AGAGCCAATG 
ATTATTGGCC GCAACTTTTT AGTAAAAATT AACGGCAATA TCGGCAACAG TGCGGTTACC 
TCATCTATTG AAGAAGAAGT GGCGAAGTTA ACCTGGGGCA CGCGCTGGGG TGCCGATACC 
ATTATGGATC TGTCCACCGG TAAAAATATT CACGAAACGC GCGAGTGGAT TATTCGCAAC 
TCGTCAGTGC CCATTGGTAC AGTACCTATT TACCAAGCTT TAGAAAAAGT AGATGGCGTA 
GCCGAAGATC TAACGTGGGA GATTTTCCGC GATACCCTCA TCGAGCAAGC AGAGCAAGGG 
GTTGACTACT TCACAATCCA CGCCGGTGTA CTGTTGCGCT ATGTGCCGCT TACCGCTAAA 
CGGGTAACAG GTATTGTGTC GCGCGGCGGC TCGATTATGG CTAAATGGTG CTTGGCGCAT 
CACCGCGAAA ACTTTTTATA CACCCATTTC GAAGACATTT GCGAAATTAT GAAAGCTTAC 
GATGTGAGCT TTTCTTTGGG GGATGGCTTG CGCCCAGGCT CCATTGCCGA CGCCAACGAC 
GAAGCGCAAT TCGGCGAGCT AGAAACACTG GGCGAGCTTA CCAAAATTGC GTGGAAACAC 
GATGTGCAGG TAATGATTGA AGGCCCAGGC CACGTACCAA TGCACATGAT CAAAGAAAAC 
ATGGATAAGC AATTGCGCGA ATGTGGTGAA GCGCCGTTTT ATACCTTGGG GCCGCTGACT 
ACCGATATCG CCCCAGGCTA CGACCATATT ACCTCGGGTA TTGGTGCGGC CATGATTGGC 
TGGTACGGTT GTGCCATGCT TTGTTACGTT ACACCCAAAG AGCATTTGGG TTTACCCAAC 
AAAGACGATG TAAAAGAGGG TATCATCACT TACAAAATTG CTGCCCACGC AGCGGATTTG 
GCCAAAGGGC ACCCCGGCGC ACAGCTGCGT GACAACGCAC TCTCTAAGGC GCGCTTTGAA 
TTCCGTTGGG AAGATCAGTT TAATTTGGGC TTAGACCCAG ATACTGCGCG GTCTTATCAC 
GACGAAACGC TGCCAAAAGA TTCCGCTAAA GTTGCGCACT TTTGCTCTAT GTGTGGCCCC 
AAGTTCTGCT CGATGAAAAT CACCCAAGAG GTGCGCGATT ACGCAGCAGA ACACGGTACA 
GATATTACAC CAATCGCCGA AGATGAAGTG GTACGAATGA TTGATGTAGA AGCCGAAATG 
CGCAAGAAGT CGGAGGAGTT CCGCGAGAAG GGCAGTGAGA TATATGGGAA AATCTAG

Protein sequence

MTTDTLEKPR LSDTAQVDSQ SIAPFPNSKK IYVQGSRPDI RVPMREINLS ITPTEFGGEQ 
NPPVRVYDTS GVYTDPNVKI DVRQGLPDVR SAWIAERGDT EVLQQKSSSF TQQRLHDASL 
DTLRFNHQRQ PLKAKPRANV TQMHYARCGI ITPEMEYIAI RENMSWQQAK EQGVLDQQHA 
GEHFGANIPD EITPEFVRSE VACGRAIIPA NINHPELEPM IIGRNFLVKI NGNIGNSAVT 
SSIEEEVAKL TWGTRWGADT IMDLSTGKNI HETREWIIRN SSVPIGTVPI YQALEKVDGV 
AEDLTWEIFR DTLIEQAEQG VDYFTIHAGV LLRYVPLTAK RVTGIVSRGG SIMAKWCLAH 
HRENFLYTHF EDICEIMKAY DVSFSLGDGL RPGSIADAND EAQFGELETL GELTKIAWKH 
DVQVMIEGPG HVPMHMIKEN MDKQLRECGE APFYTLGPLT TDIAPGYDHI TSGIGAAMIG 
WYGCAMLCYV TPKEHLGLPN KDDVKEGIIT YKIAAHAADL AKGHPGAQLR DNALSKARFE 
FRWEDQFNLG LDPDTARSYH DETLPKDSAK VAHFCSMCGP KFCSMKITQE VRDYAAEHGT 
DITPIAEDEV VRMIDVEAEM RKKSEEFREK GSEIYGKI