Gene Sros_9103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_9103
Symbol
ID	8672449
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	10048478
End bp	10050211
Gene Length	1734 bp
Protein Length	577 aa
Translation table	11
GC content	71%
IMG OID
Product	thiamine pyrophosphate protein domain protein TPP-binding protein
Protein accession	YP_003344469
Protein GI	271970273
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCACCG TTGCGGAGCA GTTCGTCGAG GTGTTGCGCC AGGCCGGGGT GGAGCGGGTC 
TACGGGGTGG TGGGCGACAG CCTGAACCCG GTCGTGGACG CGATCCGCAA GACCGGCGGC 
ATCGAGTGGG TGCACGTGCG CAACGAGGAG GCGGGGGCGT TCGCCGCCGC GGCCGAGGCG 
CAGATCACCG GCCGCCTGGC GGTCTGCGCG GGGAGCTGCG GACCCGGTAA CACGCACCTG 
GTCCAGGGGC TCTACGACGC CCACCGGAGC GGCGCCCCGG TGCTCGCCCT TGCCTCGCAC 
ATCTCCAGCG CGCAGATCGG CACGGGGTTC TTCCAGGAGA CCCACCCGGA CCGCCAGTTC 
GTGGACTGCA GCGGCTACTG CGAGATGATC AGCAGCGCCG AGCAGATGCC CCGGGTGCTG 
CGCATCGCCG TCCAGCACGC GATCGGCCAC AGCGGCGTCG CGGTCGTGGT GCTCCCCGGC 
GACGTGGCGG ACCTGCCGGC CGCGCGCGGC ACCGGCACCC ACGAGTTCCT CACCCGGCAG 
GGCACGATCC GGCCCCTTTC CGACCAGGTG GCGGAGCTGG CCACGGCGCT GAACAGCGCG 
GAGAAGGTGA TGCTGTTCTG CGGCGCCGGG GTGCGCCGCG CGCACGAGGA GGTCATGTCA 
CTGGCCGCCC GCACGCTGGC CCCGGTCGGG CACGCGCTGC GCGGCAAGGA GTGGATCCAG 
TACGACAACC CGTACGACGT GGGGATGAGC GGGCTGCTCG GCTACGGCGC GTGTTACGAG 
GCCATGCACG AGGCCGACCT GGTGGTGCTG CTCGGCACCG ACTTCCCCTA CGACGACTTC 
CTGCCGGGCA GGCGGACGGT CCAGATCGAC CACGACCCCG CGCAGCTGGG CCGCAGGACC 
CCGCTGGAGC TGGCCGTGCA CGGCGACGTC CGCGAGACGC TGCTCGCGGT GCTGCCCCAG 
GTCGCGCAGA AGACGGACCG GCGCTACCTC GACAAGATGC TGTCCAAGCA CGTGAAGACG 
CTGGACAACG TCGTGAACGC CTACACCCGC GACATCGAGC ACCACACACC GATCCATCCG 
GAGTACGTGG CGAGCGTCGT GGACGAGCTC GCCGCCGACG ACGCGGTGTT CACCGTTGAC 
ACCGGCATGT GCAACGTCTG GGCGGCGCGC TATCTCACTC CCAACGGCCG CCGCAGGGTG 
ATCGGCTCCT TCAAGCACGG GAGCATGGCC AACGCGCTCC CGCACGCCAT CGGCGCGCAG 
CTCGCCGGCC GCGGGCGGCA GGTCGTCTCG CTCTCCGGCG ACGGCGGGCT CGGCATGCTC 
ATGGGCGAGC TCCTCACCGC CCGGATGTAC GACCTGCCCG TCAAGATCGT GGTGTTCAAC 
AACTCCTCGC TCGGCATGGT GAAGCTGGAG ATGCTGGTCG ACGGGCTGCC CGACTTCGGC 
ACCGACGTCG CGCCCGTCGA CTACGCGGCG ATCGCCGCCG CGATCGGGCT GGGGTCGGTC 
CGGGTGGAGA AGCCCGCGCA GGTCCGGGAG GCGCTGGCCA CCGCCTTCGC GGCGCCGGGG 
CCGTACCTGG TGGACGTGGT CACCGACCCC GACGTGCTCT CCATGCCGCC GCGCATCACC 
GCCAAGCAGG TCAAGGGGTT CGCTCTGGGG GCGGGGAAGG TCGTGCTGAC CGGCGGGGTG 
GGACGCATGA TCGACATGGC CAGGGCGAAC CTGCGGAACA TCCCGCGCCC GTGA

Protein sequence

MGTVAEQFVE VLRQAGVERV YGVVGDSLNP VVDAIRKTGG IEWVHVRNEE AGAFAAAAEA 
QITGRLAVCA GSCGPGNTHL VQGLYDAHRS GAPVLALASH ISSAQIGTGF FQETHPDRQF 
VDCSGYCEMI SSAEQMPRVL RIAVQHAIGH SGVAVVVLPG DVADLPAARG TGTHEFLTRQ 
GTIRPLSDQV AELATALNSA EKVMLFCGAG VRRAHEEVMS LAARTLAPVG HALRGKEWIQ 
YDNPYDVGMS GLLGYGACYE AMHEADLVVL LGTDFPYDDF LPGRRTVQID HDPAQLGRRT 
PLELAVHGDV RETLLAVLPQ VAQKTDRRYL DKMLSKHVKT LDNVVNAYTR DIEHHTPIHP 
EYVASVVDEL AADDAVFTVD TGMCNVWAAR YLTPNGRRRV IGSFKHGSMA NALPHAIGAQ 
LAGRGRQVVS LSGDGGLGML MGELLTARMY DLPVKIVVFN NSSLGMVKLE MLVDGLPDFG 
TDVAPVDYAA IAAAIGLGSV RVEKPAQVRE ALATAFAAPG PYLVDVVTDP DVLSMPPRIT 
AKQVKGFALG AGKVVLTGGV GRMIDMARAN LRNIPRP