Gene Sros_5566 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5566
Symbol
ID	8668860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	6086601
End bp	6088439
Gene Length	1839 bp
Protein Length	612 aa
Translation table	11
GC content	73%
IMG OID
Product	thiamine pyrophosphate binding domain-containing protein
Protein accession	YP_003341061
Protein GI	271966865
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACTGA CAGTGGCCCA GGCGCTCGTG CGCTTCCTCG CCCAGCAGTG GACCGAACGC 
GACGGCGCCG AGCAGCGGCT GATCGCCGGA TGCCTGGGCA TCTTCGGCCA CGGCAACGTC 
GCCGGCATCG GCCAGGCCCT CGCCGAACAG GGCGCCGGCA CCCACGCGGC CCTGCCCTAC 
TACCTGGCCC GCAACGAACA GGCCATGGTG CACACCGCCG TCGGCTACGC CCGTACCCGC 
GACCGTCTGA CCACCTTCGC CTGCACCACC TCCATCGGGC CCGGCGCCAC CAACCTCGTC 
ACCGGCGCCG CCCTGGCCAC CATCAACCGC ATCCCGGTGC TGCTGCTGCC CGGCGACGTC 
TTCGCCACCC GCGCCGCCTC CCCGGTGCTG CAGGAGCTGG AAGACCCCCG CTCCTACGAC 
GTCACCGTCA ACGACACCCT GCGGCCGGTC AGCCGCTTCT TCGACCGGAT CAACCGCCCC 
GAGCAGTTGC CCTCGGCACT GCTGGCCGCG ATGCGGGTGC TGACCGACCC GGCCGAGACC 
GGCGCGGTCA CCCTGGCCCT GCCCCAGGAC GTCCAGGCCG AGGCCTACGA CTGGCCCGAG 
GAGCTGTTCC GCCGGCGCGT CTGGCACGTG GCCCGCCCGG TGCCCGAACC CGCCGCGCTG 
GCCCGCGCCC AGGACCTGCT GCGGCGATCA CGCCGGCCGC TGATCGTGGC CGGCGGCGGC 
GTCAAACACA GCCAGGCCTC GCATCAGCTG GCCGCCTTCG CCGCCCGCCA CCGCATCCCG 
GTCACCGAGA CCCAGGCAGG CAAGGGCGCC GTGCCGTACG ACCACCCGTA CGCCGCCGGC 
GCGATCGGCC ACACCGGCAG CGCCGCGGCC AACACCCTGG CCCGCGAGGC CGACCTGGTC 
ATCGGCATCG GCACCCGCTA CAGCGACTTC ACCACCGCCT CACGCACGCT GTTCGCCGGC 
GCGGCCTTCC TCAACATCAA CATCACCGCC TTCGACGCGG CCAAGCACTC CGGCCAGATG 
CTCGTCGCCG ACGCCCGCCA GGCGCTGGAC GCGCTGGAGC CCGGCGACTG GAACGCCGAC 
CCCGCCTGGA GCGCCAGAGC CACCGAGCTG ACCCGCGACT GGCAGGCCGA GATCGAGCGC 
GCCTACGGGG GGACGGAGCT GACCCAGCCG GTGATGCTGG GAATCGTCAA CCAGGCCGCC 
GAGGGCGGCG TGGTGGTCAA CGCGGCCGGG TCCATGCCCG GCGACCTGCA CAAGCTGTGG 
CGGGCCACCG ACCCCGGCCA GTACCACGTG GAGTACGGCT ACTCCTGCAT GGGATACGAG 
ATCGCCGGCG GGCTCGGGGT GAAGCTGGCC GCGCCGGAGC GAGAGGTGTT CGTGCTGGTC 
GGCGACGGCT CCTACCTGAT GATGGCCCAG GAGATCGCCA CCGCCGTGCA GGAGGGCGTC 
AAACTCGTCG TGGTGCTGGT CGACAACCAC GGCTTCGCCT CCATCGGCAA CCTCAGCGAA 
TCCGTCGGCG CCCAGCGGCT CGGCACCTCC TACCGGATGC GCGGCCCCTC GGGCGAGCTC 
GACGGGGCCT TCCTCCCGGT GGACCTGGCC GCCAACGCCG CCAGCCTGGG CGCCGACGTG 
CTGACGGCGA ACGACCCCGG CACGCTGCGG ACCGCACTGG CCAAGGCCAT GGCGTCCACG 
CGCACCACGG TCGTCCACGT CGAGACCGTC CCCGGCCCAA GTCCCGAGAC CACGGCCTGG 
TGGGACGTGC CGGTGGCCGA GGTGTCGAGC CTGCCCGAGG TCAGGACCGT GCGCCGGCAC 
TACGAAGACC ACAAACGCGA CCAGCGGCCC TACCTCTGA

Protein sequence

MRLTVAQALV RFLAQQWTER DGAEQRLIAG CLGIFGHGNV AGIGQALAEQ GAGTHAALPY 
YLARNEQAMV HTAVGYARTR DRLTTFACTT SIGPGATNLV TGAALATINR IPVLLLPGDV 
FATRAASPVL QELEDPRSYD VTVNDTLRPV SRFFDRINRP EQLPSALLAA MRVLTDPAET 
GAVTLALPQD VQAEAYDWPE ELFRRRVWHV ARPVPEPAAL ARAQDLLRRS RRPLIVAGGG 
VKHSQASHQL AAFAARHRIP VTETQAGKGA VPYDHPYAAG AIGHTGSAAA NTLAREADLV 
IGIGTRYSDF TTASRTLFAG AAFLNINITA FDAAKHSGQM LVADARQALD ALEPGDWNAD 
PAWSARATEL TRDWQAEIER AYGGTELTQP VMLGIVNQAA EGGVVVNAAG SMPGDLHKLW 
RATDPGQYHV EYGYSCMGYE IAGGLGVKLA APEREVFVLV GDGSYLMMAQ EIATAVQEGV 
KLVVVLVDNH GFASIGNLSE SVGAQRLGTS YRMRGPSGEL DGAFLPVDLA ANAASLGADV 
LTANDPGTLR TALAKAMAST RTTVVHVETV PGPSPETTAW WDVPVAEVSS LPEVRTVRRH 
YEDHKRDQRP YL