Gene Swit_4701 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Swit_4701
Symbol
ID	5199095
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingomonas wittichii RW1
Kingdom	Bacteria
Replicon accession	NC_009511
Strand	+
Start bp	5171224
End bp	5172348
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	69%
IMG OID	640584255
Product	bifunctional sulfur carrier protein/thiazole synthase protein
Protein accession	YP_001265176
Protein GI	148557594
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG2022] Uncharacterized enzyme of thiazole biosynthesis [COG2104] Sulfur transfer protein involved in thiamine biosynthesis
TIGRFAM ID	[TIGR01683] thiamine biosynthesis protein ThiS

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.468322
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.837099
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGGGC GATCCGCCAC GCGGCAAGCC TTTCCGTTGC GATGGTGCGA CCCGCACCCC 
TATATGGCCC CCCGACGCAA AGCGAAAGCG CATACGGCGC CACCCATTGG AGATCCCATG 
ACCAATCCCG ACGGCACGAT CCAGGTCCGC ATCAACGGCG AGCACCGCCG GGTCAGGGCA 
GGGCTGACGA TCGCCGACCT CGCGCTGGAA CTGGGGCTGG AGCCGACCAA GGTCGCGGTC 
GAGCGCAATC TGGAGGTTGT GCCCCGCTCG ACCTTGGGGC AGGTGCTGCT CGACGATGGC 
GACGAGCTGG AAATCGTCCA TTTTGTTGGT GGTGGAGATC ATGGCGTGAC GCTTGACGAC 
GACAGCTGGA CGGTGGCGGG GCGGACCTTC CGGTCGCGGC TGATCGTCGG CACCGGCAAG 
TACAAGGACT TCGCCCAGAA CGCCGCCGCG GTCGAGGCGT CGGGGGCGGA GATCGTCACC 
GTCGCGGTCC GTCGCGTCAA CGTCGCCGAT CCCAAGGCGC CGATGCTGAC CGACTATATC 
GACCCGAAGA AGATCACCTA TTTGCCCAAC ACCGCCGGCT GCTACACCGG CGAGGAGGCG 
ATCCGCACGC TGCGCCTGGC GCGCGAGGCG GGCGGCTGGG ACCTCGTCAA GCTCGAGGTG 
CTGGGCGAGG CGAAGACGCT CTATCCCGAC ATGGTCGAGA CGCTGCGGGC GACCGAGGTG 
CTGGCCAAGG AAGGCTTCAA GCCGATGGTC TATTGCGTCG ACGATCCGAT CGCCGCCAAG 
CGGCTGGAGG ATGCCGGCGC GGTCGCGATC ATGCCGCTCG GCGCGCCGAT CGGCTCGGGC 
CTCGGCATCC AGAACCGGGT GACGATCCGC CTGATCGTCG AGGGCACCAG CCTGCCGGTG 
CTGGTCGACG CCGGGGTCGG CACCGCGTCG GAGGCGTCGT CGGCGATGGA GCTGGGCTGC 
GCGGGCGTGC TGATGAACAC CGCGATCGCC GAGGCGAAGA ACCCGGTGAT GATGGCGCGC 
GCGATGAAGC TGGCGGTCGA GAGCGGCCGC CTCGCCTATC GCGCCGGCCG CATGGGCCGC 
CGCATGTACG CCGATCCGTC GAGCCCGCTG GCCGGGCTGA TCTGA

Protein sequence

MTGRSATRQA FPLRWCDPHP YMAPRRKAKA HTAPPIGDPM TNPDGTIQVR INGEHRRVRA 
GLTIADLALE LGLEPTKVAV ERNLEVVPRS TLGQVLLDDG DELEIVHFVG GGDHGVTLDD 
DSWTVAGRTF RSRLIVGTGK YKDFAQNAAA VEASGAEIVT VAVRRVNVAD PKAPMLTDYI 
DPKKITYLPN TAGCYTGEEA IRTLRLAREA GGWDLVKLEV LGEAKTLYPD MVETLRATEV 
LAKEGFKPMV YCVDDPIAAK RLEDAGAVAI MPLGAPIGSG LGIQNRVTIR LIVEGTSLPV 
LVDAGVGTAS EASSAMELGC AGVLMNTAIA EAKNPVMMAR AMKLAVESGR LAYRAGRMGR 
RMYADPSSPL AGLI