Gene Sros_1781 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1781
Symbol
ID	8665059
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	1897265
End bp	1898413
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	73%
IMG OID
Product	imidazolonepropionase
Protein accession	YP_003337514
Protein GI	271963318
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.381762
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCACGC TTCTCGACCG GATCGGACTG CTCTACACCG GTGATCCGGA GCGGGAGGAG 
ATCGAGGACG CCGCCATCGT GGTCGAGGAC GGCCGGGTGG TATGGACCGG GACCGCCGGT 
GCCGACCCCG GCGCCGACGA GCGCGTGGAC GTGGGCGGGC GCTGCGTGAT CCCCGGGTTC 
GTGGACAGCC ACGCCCATCT GGTCTTCGCC GGCGACCGCA CCGCGGAGTT CACCGCCCGC 
ATGTCGGGGG AGCCCTACAC CGCCGGCGGG ATCCGCACCA CGGTCGCGGC CACCCGCGCG 
GCCGGCGACG CCCTTCTCGC GGAGCGGACC GCCGCCCTGG TCACCGAGAT GCTCGCCCAG 
GGGACCACCA CCGTCGAGAT CAAGAGCGGC TACGGCCTCA CGGTCGAGGA CGAGCGCCGG 
TCCCTGGAGA TCGCCCGGCG GTTCACCCGG GAGACCACTT ATCTGGGCGC GCACGTCGTC 
CCGCCGGACG CCCCCTCCGC CGACGACTAC GTCCGCATGG TCACCGGGGA GATGCTGGAG 
GCCTGCGCGC CGTACGCCAG GTGGGTGGAC GTGTTCTGCG AGCGCGGGGC GTTCGACGCC 
GACCAGACCA GGGAGATCCT GCTCGCCGGG ACCAAGGCCG GGCTGCTGCC CCGGATCCAC 
GCCAACCAGC TGGGCAACGG GCCGGGCGCG CAGATCGCCG CCGAGATGGG CGCCGCCTCC 
GCCGACCACT GCACCCACCT GACCGACGAG GACGTCTCCG CGCTGTCCTC GGCCGGAGTG 
GTGGCCACCC TGCTGCCCGG CGCGGAGTTC TCCACCCGCT CGCCGTACCC GGACGCGCGC 
CGGCTGCTGG ACGCCGGGGT GACCGTCGCG CTGGCCACCG ACTGCAACCC CGGCTCCTCC 
TTCACCTCGT CCATGCCGTT CTGCCTGGCG CTGGCCGTCC GGGAGATGCG GATGACACCG 
CTGGAGGCGG TCAGGGCCGC CACGTACGGC GGAGCCATGG CGTTGCGCCG CGACGACGTC 
GGCACGCTGA GGGTGGGGGC CCGCGCCGAT CTGGTGATCC TGGACGCCCC GTCCTACGTC 
CATCTGGCTT ACCGGCCGGG GGTACCGCTG GCGGCGCAGG TGTGGAAGGA GGGCCACCGC 
CTGGTTTGA

Protein sequence

MSTLLDRIGL LYTGDPEREE IEDAAIVVED GRVVWTGTAG ADPGADERVD VGGRCVIPGF 
VDSHAHLVFA GDRTAEFTAR MSGEPYTAGG IRTTVAATRA AGDALLAERT AALVTEMLAQ 
GTTTVEIKSG YGLTVEDERR SLEIARRFTR ETTYLGAHVV PPDAPSADDY VRMVTGEMLE 
ACAPYARWVD VFCERGAFDA DQTREILLAG TKAGLLPRIH ANQLGNGPGA QIAAEMGAAS 
ADHCTHLTDE DVSALSSAGV VATLLPGAEF STRSPYPDAR RLLDAGVTVA LATDCNPGSS 
FTSSMPFCLA LAVREMRMTP LEAVRAATYG GAMALRRDDV GTLRVGARAD LVILDAPSYV 
HLAYRPGVPL AAQVWKEGHR LV