Gene Sros_3052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3052
Symbol
ID	8666339
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	3329975
End bp	3331729
Gene Length	1755 bp
Protein Length	584 aa
Translation table	11
GC content	75%
IMG OID
Product	Thiamine pyrophosphate-requiring protein-like protein
Protein accession	YP_003338747
Protein GI	271964551
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.912898
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.512138
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACGTCG CCGAGGCCGT GGGCCGCGTC CTCGCCTCGC TCGGTGTGGA CACCGCCTTC 
GGCGTGGTCG GCAGCGGCAA CTTCCACGTG ACCAACGCGC TGGTCGAGCA CGGCGTGCGG 
TTCGTCGCCG CACGCCACGA GGGCGGCGCG GCGACCATGG CCGACGCCTA CGCGCGCACC 
GGCGGCCGGG TCGGCGTGCT CAGCGTCCAC CAGGGGCCGG GGCTCACCAA CGCGATGACC 
GGCATCACCG AGGCCGCCAA GAGCCGCACG CCGCTCATCG TGCTGGCCGC CGAGGTGACC 
GAGCCCCGGT CCAACTTCTT CGTCGACCAG GCCGCCCTCG CCACGGCGGT CGGCGCCGTC 
CCCCTGCGGA TCACCTCCGC CGGGACCGCC GTCGCGGAGA CGCTCCAGGC GTTCCACCTG 
GCCCGCGACG GGCGGCGCAC GGTCCTGCTG AACCTCCCGC TGGAGGTCCA GGGCCGGCCC 
GTCCCCACCC CGCCCGCTCC CGCCTCTCTC GCCTCCGTCC CGGAGCCCTC CGAGCCGGAG 
GCGAGGGAGG TCGCGCGGCT GGCGGAGCTT CTCGGGGCCG CGCGGCGGCC GGTGTTCGTG 
GCGGGGCGGG GAGCACGCGC GGCCAGGCTG GAGCTGGAGG AGCTCGCTGA GCGGATCGGG 
GCGCTGCTCG CCACCTCCGC CGTGGCCAAG GGACTCTTCC GGGGCAGCCC GTGGGATCTG 
GACGTGAGCG GTGGCTTCGC CTCGCCTCTC ACCGCCGAAC TCGTCCGCGG CGCCGACGTG 
ATCGTCGGCT GGGGCTGCGC GCTCAACATG TGGACCATGC GCCAGGGCAC GCTCATCGGC 
CCGGAGGCCA AGGTCGCCCA GGTCGACCTG GACGCCGACG CCCTCGGCGC CCACCGGCCG 
ATCGATCTCG GCGTGGTCGG CGACGTCGCC CTCACCGCGC GGTCCGTCAC CACCCTGCTC 
GCCGGGGGCG GGGACGACCT CCGCCAGGCG TCCGCCGCGC GGGACGGGGC AGGCCGGGAG 
GCTTCTGCCG TACCGGGCGA CGGGCCCGGG GCGCCGGACG CGCCGGGTGG GAGCGGTCCC 
GGCGCGCCGG GTGGCATCGG GTACCGGTCG CGGGTGTTGG CCGAGCGGAT CGCCCGCGAG 
AACCGCTGGC GGGACGTGCC CTATGCCGAC GAGGGGGGCG AGGGCCGCAT CGACCCCCGC 
ACCCTCACGA TCGAGCTGGA CGACCTCCTC CCCGCCGAAC GCGTCGTCTC CGTCGATTCC 
GGAAATTTCA TGGGATATCC GTCGATGTTC CTCGACGTCC CAGATGAACG CGGTTTCTGC 
TTCACCCAGG CATTTCAGTC CATCGGCCTC GGCCTGGCCA CCGCGATCGG CGCCGCCCTG 
GCCCAACCGG CCCGACTCGC GGTGGCGGCG CTGGGCGACG GGGGCGCGCT GATGGGCGTC 
GCCGAGTTGG AGACGGTCGT ACGGCTCGGC CTTCCGATGG TGATCGTGGT CTATGACGAC 
GAGGGCTACG GGGCCGAGGT CCACCACTTC GGCCCGGACG GGCACAGCCT GGACACCGTC 
ACCTTCCCGC CCGTCGACAT CGCCGCCATA GCCCGGGGTT TCGGCTGCGA GGCGGTGACC 
GTACGGGGCC GGGAGGACCT CGCCGCGGTG GCCGGATGGC TGGACGGGCC GCGGCACCGG 
CCGCTGCTGG TCCACGCCAA GGTCAGTGGC GCGCGGGGGT CGTGGTGGCT GGAGGAGGCC 
TTCCGCGGGC ATTGA

Protein sequence

MNVAEAVGRV LASLGVDTAF GVVGSGNFHV TNALVEHGVR FVAARHEGGA ATMADAYART 
GGRVGVLSVH QGPGLTNAMT GITEAAKSRT PLIVLAAEVT EPRSNFFVDQ AALATAVGAV 
PLRITSAGTA VAETLQAFHL ARDGRRTVLL NLPLEVQGRP VPTPPAPASL ASVPEPSEPE 
AREVARLAEL LGAARRPVFV AGRGARAARL ELEELAERIG ALLATSAVAK GLFRGSPWDL 
DVSGGFASPL TAELVRGADV IVGWGCALNM WTMRQGTLIG PEAKVAQVDL DADALGAHRP 
IDLGVVGDVA LTARSVTTLL AGGGDDLRQA SAARDGAGRE ASAVPGDGPG APDAPGGSGP 
GAPGGIGYRS RVLAERIARE NRWRDVPYAD EGGEGRIDPR TLTIELDDLL PAERVVSVDS 
GNFMGYPSMF LDVPDERGFC FTQAFQSIGL GLATAIGAAL AQPARLAVAA LGDGGALMGV 
AELETVVRLG LPMVIVVYDD EGYGAEVHHF GPDGHSLDTV TFPPVDIAAI ARGFGCEAVT 
VRGREDLAAV AGWLDGPRHR PLLVHAKVSG ARGSWWLEEA FRGH