Gene Sros_2142 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_2142
Symbol
ID	8665424
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	2304144
End bp	2305505
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	69%
IMG OID
Product	permease for cytosine/purines uracil thiamine allantoin
Protein accession	YP_003337869
Protein GI	271963673
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.32672
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCCGTCG AGCAACGCGG GATCGAGCTG GTCTCGCCGT CGGAGAGGTA CGGCCGGCCG 
CGTGATCTGC TCTTTCTCTG GAGCGGCACC ACGCTCGGCA TCTTCACCCT GGTCTACGGC 
ACGGTCGTCG TCTCCCTGGG GCTGAGCTTC CCGCAGGCCG TCCTGGCCAT CGTCATCGGC 
AACCTGCTGG CCTTCCCGCT GGTCGGCCTG ACCAGCCTGC AGGGCCCGGC GGTCGGCACC 
TCCACCATGG CGGTCTCCCG GGCCGCGTTC GGCCCCAAGG GCGCCCGGGT GCTCAGCTTC 
TTCGGCTGGA TCAACATGGT CGGCTTCGAG GCCGGCGGCA TGGTGCTGAT CACCTTCGCC 
TCGCTGGCCC TGCTCGACCA GGCCGGCGTC ACCGGCCAGA GCGCCGGGCT GAAGATCGCC 
GTGATCGTCG TCGCGGCACT GATCCAGCTC GTGCTGCCGC TGATCGGGCA CGCCGCCGTC 
ATGAAGGCGC AGAAGTACTT CACCTGGGTG TTCGTCGCGA TGTTCGCCGT CATGGGCGTA 
CTCATCGGGC CGAAGGTGCA GGTCGCCTCC TCCGGCGGCG CCGACTTCGC CACGTTCACC 
ATCGCCGTGG CGCTGGTGAT GTCGGCCGGC GGGCTGTCAT GGGCGCCGCT GGGCAGCGAC 
TACTCGCGCT ACCTGCCGGC GAGCTCCAGC AAGAAGGCCG TCTTCGGCTA CGCGATGTTC 
GGCGGGCTCG TGCCGTACAT CCTGCTGATG ACGCTCGGCG CGGCCGTCGC GACCGTGGTC 
AAGGACGCGA GTGACCCCAT CTCCGGCCTG CCCGGCGCGC TGCCGTCCTG GTTCGTGGTG 
CCCTACCTGC TGCTGGCGAT CGTCACGCTG TTCGCGGTCA ACACCACCGA CCTCTACTCC 
TCCGGCCTGA ACCTGCAGGC CTCCGGGATC AAGCTGAGCC GGTCCGTCGC GGTCGTGCTC 
GACCTGGTGA TCTGTGTCGC GATCACCTGC GTGGCGGTGT TCTCCGACTC CTTCAACACC 
ATGCTCAACA CCTTCCTCGG CCTGCTGATC CTCTGGCTGG CCCCCTGGGC GGGCATCTAC 
CTGACCGACT GGCTGCGGCG CAGGGGCCGC TACGACGCCG AGGGCCTGTT CTCCGACGGC 
GGACCGTACC ACGGCAGCGG CGGCATCCGC TGGACCGGCA TCATCGCGCA GGTCGCGGGC 
ATGATCGCGG CAGCGCTCTG GATCAACTCC ACGGCCTTCA CCGGGCCGCT CTCCGAGATC 
ACCGGCGGCT CCGACTTCAG CATCTTCGCG GGCTTCCTGG TGGCGGGCCT GGTGTACGTC 
GCACTCGACC GCCGCCCCGT CCCCGTCCCC GTCCCCGCCT GA

Protein sequence

MAVEQRGIEL VSPSERYGRP RDLLFLWSGT TLGIFTLVYG TVVVSLGLSF PQAVLAIVIG 
NLLAFPLVGL TSLQGPAVGT STMAVSRAAF GPKGARVLSF FGWINMVGFE AGGMVLITFA 
SLALLDQAGV TGQSAGLKIA VIVVAALIQL VLPLIGHAAV MKAQKYFTWV FVAMFAVMGV 
LIGPKVQVAS SGGADFATFT IAVALVMSAG GLSWAPLGSD YSRYLPASSS KKAVFGYAMF 
GGLVPYILLM TLGAAVATVV KDASDPISGL PGALPSWFVV PYLLLAIVTL FAVNTTDLYS 
SGLNLQASGI KLSRSVAVVL DLVICVAITC VAVFSDSFNT MLNTFLGLLI LWLAPWAGIY 
LTDWLRRRGR YDAEGLFSDG GPYHGSGGIR WTGIIAQVAG MIAAALWINS TAFTGPLSEI 
TGGSDFSIFA GFLVAGLVYV ALDRRPVPVP VPA