Gene Sros_4041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_4041
Symbol
ID	8667335
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	4498717
End bp	4499841
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	78%
IMG OID
Product	hydantoinase
Protein accession	YP_003339692
Protein GI	271965496
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.711164
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0015292
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGATCCTCG GCGTCGATCT CGGATGGCAC GCGCCGGTGG TGGCGGCCGT CCGGGACGGT 
GCCCTGACGG AGGCGGGAGC GGCGGTCAGG GCGGTGTCGG TCGCGGTGGA CCTGGACACC 
GTACGGCGGG CACGGGTCGC GGCGATCAGG GTCGCCGGGC CGTGCCCGCC GGGGCTCGGC 
CCCCTGGCGG GCTGGCCGGA CGGCTCGGGG GTGGGGAAGG TCGTCCGGGG CGGCCACAGC 
CTCACCGGGC GGCCGATCGC CGAGCTGGAC GCCGCCGCGG TGGCCCGGTT CGCCGCCGGG 
TGCGGCCTGA CGGACTTCGC GGTGACCGCG ACCGGGTCGC CGGGGCTGCC CGACCACGAG 
CTGGCCGTCG CCGAGATCAT CACGGCCGAG GTGCCCGGGG CGCGGATCAC CCTGTCGTAC 
GAGTTCGGCC GGGCCGGGCT GCGGGAGAGG GAGAACAGCG CGATCCTGAA CGCGGCGCTC 
GGTCCGGAGG CGGACCGGAT CGCGGGCCGG GTCGCCGCCG GGGTGGCCCG CGACCTGCCG 
GGGACGCCGC TGTTCTTCGC CAGGACCGGG ACGGGCCTGG TCTCGGCCCA CTACTTCCGC 
CGCTACCCGC TGGTCTGCTA CCTGGGCGCC TTCACCTGCG CGCTGCGCGG CGGCGCGGCG 
CTGGCCGGGC TGGGCGACAC CGCGGTCCAG GAGCGGGGGA GGACGGTGCG TACCGGCCTC 
GTGGCCGGAG GAGTACCCAG GACCGGGGGA CGGCGCGGCG CGGACGTCCC GGTCAACGTG 
CCGCTGCCGA TGCTCGTGTC GGCTCCGGGG GGCGTCGCGG TGGGGCCCTT CGCACGGGAG 
GCGGGGCCGG GCTGGCAGGT GCCGGAGCGG GCGGAGCTGG CCGTGGCCTA CGGGGCGGCG 
CTGGCCGGGC CCGCCGCCGA GGTGGAGCGG ATCGTGCACG CCCGGGGCCG GGCCGAGCTC 
GACCGGGCGA TCGACGACGC CCGCGACGAG GCGCTGACGC GCGTGGTGAG CGCCGGGGCG 
GTCCCCGGAT CCGCCCGCGT CGCCACCACG GTCGTCAACC CGCTCTCCTA CCTGCCCGAC 
GGTCTCTACC GGGTCCAGGT CAAGGCGGAG GGGACGGCTC CGTGA

Protein sequence

MILGVDLGWH APVVAAVRDG ALTEAGAAVR AVSVAVDLDT VRRARVAAIR VAGPCPPGLG 
PLAGWPDGSG VGKVVRGGHS LTGRPIAELD AAAVARFAAG CGLTDFAVTA TGSPGLPDHE 
LAVAEIITAE VPGARITLSY EFGRAGLRER ENSAILNAAL GPEADRIAGR VAAGVARDLP 
GTPLFFARTG TGLVSAHYFR RYPLVCYLGA FTCALRGGAA LAGLGDTAVQ ERGRTVRTGL 
VAGGVPRTGG RRGADVPVNV PLPMLVSAPG GVAVGPFARE AGPGWQVPER AELAVAYGAA 
LAGPAAEVER IVHARGRAEL DRAIDDARDE ALTRVVSAGA VPGSARVATT VVNPLSYLPD 
GLYRVQVKAE GTAP