Gene Sros_2271 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_2271
Symbol
ID	8665553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	2454855
End bp	2456063
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	72%
IMG OID
Product	imidazolonepropionase (imidazolone-5-propionate hydrolase)
Protein accession	YP_003337996
Protein GI	271963800
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.282195
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGTCC GCCTTCTGAC CAACATTGGC CGGCTCTGGA CCGGCAATGA CGTGTGCAGC 
AACGCGGCGA TCCTGGTCCA CAACGACCGG ATCGCGTGGG TCGGCCGTGC GGCGGACCTG 
CCGCAGAGCG TTCCAGGCGT GGTGGACGAC ATCGTCGATG TCGACCATGT CGAGAACCTG 
GGCGGCGCGC TGGTCACGCC CGGTCTGATC GACGCTCACA CCCACCCGGT CTACGCGGGA 
AACCGCTACG CCGAGATGGC GATGCGCTCC GGCGGCTCCA CGCCGTCCGC GATCACCGCC 
GCCGGCGGCG GCATCGGCTC CACCGTCACG GTGACCCGAG GCACCGACCC GTGGACCCTG 
TGCAACGGTG TCCGGGAGCG CCTTCGCGAG TGGCTGCTCA GCGGCACCAC CACCGTGGAG 
GCCAAGACCG GCTACCACCT CACCCGCGAC GGCGAGCTGG CCGACGTGCG ACTCCTGCGC 
GAGCTCGAAA AAGAGCCGAT GATGCCGCGC GTGCACGTCA CCTTCATGGC CGCGCACGTC 
GTCCCGCCGG AATACTTCGG CCGTCAGCGC GACTACGTCG AAGCCGTGGG CGCGTGGTGC 
GCCGACGCGG CCGCGGCGGG AGCCGACAGC GTCGACGTCT ACTGCGACGA GGGGCACTTC 
ACCACCGAAG AGGCCCGCTG GGTCCTCGCC TCCGGCCGCA ACGTCGGCCT GCTGCCCCGC 
GTGCACGCCG GCGCCTACAG CCGCCGCGGC GCCGTCCAGC TCGCGGCCGA GCTCGGCTGC 
GCCTCCGCCG ACCTGCTCCA CCACACCTCC GACGAGGACA TCTCGATCCT GGCCCGCTAC 
GGCGTCCCCG CCGTGGTCTG CCCGGGAACC GCCCTCCAGC GCGGCAGCCT GCCACCGGTC 
CGCCGCATGC TCGCCCAGGG CGTCACGGTG GCACTCGGCA GCGACCACAA CCCCGGTCAC 
TGCGGAATCA CCTCGATGTC CCTGGTCATC AGCCTCGCCG TGGCCGCCTT CGGCATGAGC 
GTCGGCGACG CGCTCCGTGC CGCGACGCTC GGCGGAGCCA CCGTCCTCGG CGTTCCCGAC 
CGGGGCGTCC TCGCTCCCGG CCGCCTGGCC GACATCGTCC AGTGGGACGC CGACCACGAA 
GGCGCCTTCG CGTGGGCCTT CGGCCTCAAG CCCCGCCGGG TCTGGCGCGG CGGCAACCCC 
GTCCAGTAG

Protein sequence

MTVRLLTNIG RLWTGNDVCS NAAILVHNDR IAWVGRAADL PQSVPGVVDD IVDVDHVENL 
GGALVTPGLI DAHTHPVYAG NRYAEMAMRS GGSTPSAITA AGGGIGSTVT VTRGTDPWTL 
CNGVRERLRE WLLSGTTTVE AKTGYHLTRD GELADVRLLR ELEKEPMMPR VHVTFMAAHV 
VPPEYFGRQR DYVEAVGAWC ADAAAAGADS VDVYCDEGHF TTEEARWVLA SGRNVGLLPR 
VHAGAYSRRG AVQLAAELGC ASADLLHHTS DEDISILARY GVPAVVCPGT ALQRGSLPPV 
RRMLAQGVTV ALGSDHNPGH CGITSMSLVI SLAVAAFGMS VGDALRAATL GGATVLGVPD 
RGVLAPGRLA DIVQWDADHE GAFAWAFGLK PRRVWRGGNP VQ