Gene Sros_4853 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_4853
Symbol
ID	8668147
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	5375559
End bp	5377040
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	70%
IMG OID
Product	N-ethylammeline chlorohydrolase
Protein accession	YP_003340414
Protein GI	271966218
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.308799
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.90716
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAGCCG ACCCGGAGGA ACACACAGTG AGCACTCTCG TCAGGGCATC GTTCGTCATC 
GGCTTCGACG GCGACGACCA TGTCATCCAC CGCGACGCGT GCGTCGTCTA CGACCGCGAC 
CGGATCGTCT ACGTCGGCCG CTCCTACGAC GGCCCGGTCG ACGAGGTGAT CGACGCCGGT 
GAGGCGATCG TCGGGCCGGG TTTCATCGAC CTGGACGCGC TGGCCGACAT CGACCACGCC 
ATCCTCGACA CCTGGCACGC CGATTCCGGC GGGCTGGGGT GGTCACAGGA CTACGCCGTC 
AACCGGCGTC GTGCCGTTTT CCCGCTCGAG GACACGCTCT TCATGCGGGA GTACGCGCTC 
ACCCAGCTCA TCCGCAACGG CATCACCACC GCGATGCCGA TCGCCGCCGA GACGCACAGC 
GCCTGGGCCG AGTCCTACGA GGAGCTCGCC GGCGTCGTGG AGATCGCCGG GCGGCTCGGC 
CTGCGCATGT ACCTGGGTCC GTCCTACCGC TCCGGCGTGC CGGTGCTGCG TGCCGACGGC 
AGCAGGGACG TGCACTGGGA GCCCGAGCTC GGCGACAAGG GGCTCGCCGA CGCGATCCGC 
TTCGTCCGGG ACGTCGACGG CGCCTACGAC GGCCGGATCC GAGGGGCGCT GCTGCCCTGC 
CGCATCGAGA CCGTCACCCT CGACCTGCTG CGCGCCACCG CCCGAGCCGC CGGGGAACTC 
GACTGCCTGG TCCGCCTGCA CTGCATGCAG GGGCTGACGG AGCTGCGGTT ACTGCGCGAA 
TGGTACGGCC GGCACCCGCT GGACGTGCTG GCAGAGGTTG GCCTGCTCGG TCCCCGGCTG 
CTGATCCCGC ACGCCCTGTA CCTCGGTGAC CCCGAGACGC CGTTCGAGGG ATCACCGGAC 
CGGCTCGCGG CCCTGGCCGG GATCGTGCAC TGCCCCCTCA CCTTCGTCAG GTACGGCGAC 
GCGCTCCGCG ACTTCGACCG TTACCGGGAG GCCGGTGTGA ACGTGGCGCT GGGCACCGAC 
TCCTTCCCGC CCGACATGAT CCGCAACATG GACTACGGCA ACAACCTGGC CAAGCTGGTC 
ACCGGACGGC TGGAGGCGGG CTCGGCCGCC GACTATTACC GGGCCGCCAC GCTGGGCGGT 
GCCCGCGCGC TGGGCCGGGA CGATCTGGGC CGACTCGCCC CCGGCGCCAA GGCCGACCTG 
GTCGTCGTGG ACCTCTCCGG CCCGCGCACC GGCCCCGTCG ACGATCCGGT CAGGACGTTG 
ATGATGAACT GCACGGGCGC CGACGTGTCC ACCGTGGTGA TCGACGGCCG GCCGGTGATG 
CGCGACCGGA CGATTCCGGG GGTGGATGAG GAGTCGATGC GGCTCCGCGC ACAGACCTAC 
TTCGAGACGA TGAAGGCCGC CTACTCCGAG CGTGACCACA TGCGCCGCGA CCCGGCACTG 
TTGTTCCCCG CGTCCTTCCG CATCGTCGAG GCCGGCTCAT GA

Protein sequence

MEADPEEHTV STLVRASFVI GFDGDDHVIH RDACVVYDRD RIVYVGRSYD GPVDEVIDAG 
EAIVGPGFID LDALADIDHA ILDTWHADSG GLGWSQDYAV NRRRAVFPLE DTLFMREYAL 
TQLIRNGITT AMPIAAETHS AWAESYEELA GVVEIAGRLG LRMYLGPSYR SGVPVLRADG 
SRDVHWEPEL GDKGLADAIR FVRDVDGAYD GRIRGALLPC RIETVTLDLL RATARAAGEL 
DCLVRLHCMQ GLTELRLLRE WYGRHPLDVL AEVGLLGPRL LIPHALYLGD PETPFEGSPD 
RLAALAGIVH CPLTFVRYGD ALRDFDRYRE AGVNVALGTD SFPPDMIRNM DYGNNLAKLV 
TGRLEAGSAA DYYRAATLGG ARALGRDDLG RLAPGAKADL VVVDLSGPRT GPVDDPVRTL 
MMNCTGADVS TVVIDGRPVM RDRTIPGVDE ESMRLRAQTY FETMKAAYSE RDHMRRDPAL 
LFPASFRIVE AGS