Gene Sros_1779 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1779
Symbol
ID	8665057
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	1894723
End bp	1895886
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	74%
IMG OID
Product	allantoate amidohydrolase
Protein accession	YP_003337512
Protein GI	271963316
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.294982
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGGGGTG CCATCGCGCA CCTCGGACGT GACGGCCGGA CCCGGGGCTA CCTGCGCGAC 
GCGTGGTCGC CCGCCGATCT GGAGCTCCGT CAGTGGTTCC GCCAGGAGGC CGCCAGACGG 
GGCCTCGACC TGCGCGAAGA CCGGAACGGC AACCTGTGGG CCTGGTGGGG CGACCCGTCG 
GACAGGCCGG GCGTCGTCAC GGGCAGCCAT CTGGACTCGG TACGGCAGGG CGGCGCCTTC 
GACGGCCCCC TCGGGGTCGT GTCCGCCTTC GCCGCCCTCG ACGCGCTGCG GGCAAAGGGC 
TTCGAGCCTC CCCGCCCGCT GGGGGTGGCC TGTTTCACCG ACGAGGAGGG CGCCAGGTTC 
GGGGTCCCCT GCATGGGCTC CCGGCTGCTC ACCGGCGCGC TCGACCCCGA CAGGGCCCGT 
GGCCTGACCG ACGACGGGGG CGACTCGATG GCCGAGGTGC TGCGCCGGGC CGGACGCGAC 
CCCGGTGAGC TGGGCCGCGA CGACGAGACC CTCAAGCACG TCGGCGTCTT CGTGGAGCTC 
CACGTCGAGC AGGGCCAGGA CCTGGTCCAC CGGGACGCCC CGGTCGGCGT GGCCGCCGCC 
ATCTGGCCGC ACGGCCGCTG GCGGTTCGAC TTCCGGGGCC AGGCCAACCA CGCGGGCACC 
ACCCGGCTGG AAGACCGCGA CGACCCGATG CTGCCCTTCG CCCGGACCGT GCTGCACGCC 
CGCCAGGCCG CCGAGCGGGG CGGCGTGGTG GCCACCTTCG GCAGGCTCCG CGTGTCGCCC 
AACAACGCCA ATGCCATCCC CGGCCTGGTC AGCGCCTGGC TGGACGCCCG GGGCGGCGAC 
GAGCACGCGG TCCGGGCGCT GGTCGCAGAG CTGACCGAGT TCTCCGGGGC CGAGGTCAGC 
GCCGAGTCGT GGACCCCCGT CGTCGACTTC GACGAGGTTC TGCGGGAGCG GCTCGCAGCG 
GTCCTGGGAG GCGCGCCCGT CCTGCCGACG GGGGCCGGCC ACGACGCCGG GATCCTGGCG 
TCCGCAGGTG TGCCCAGCGC GATGGTGTTC GTCCGCAATC CAACGGGAAT CTCACACTCC 
CCGGACGAAC ACGCTGAGAT GTCCGACTGC CACGCGGGGG TCGCCGCCCT CGCCACCGCC 
CTGGAGGAGC TGTGCCGGAG CTGA

Protein sequence

MWGAIAHLGR DGRTRGYLRD AWSPADLELR QWFRQEAARR GLDLREDRNG NLWAWWGDPS 
DRPGVVTGSH LDSVRQGGAF DGPLGVVSAF AALDALRAKG FEPPRPLGVA CFTDEEGARF 
GVPCMGSRLL TGALDPDRAR GLTDDGGDSM AEVLRRAGRD PGELGRDDET LKHVGVFVEL 
HVEQGQDLVH RDAPVGVAAA IWPHGRWRFD FRGQANHAGT TRLEDRDDPM LPFARTVLHA 
RQAAERGGVV ATFGRLRVSP NNANAIPGLV SAWLDARGGD EHAVRALVAE LTEFSGAEVS 
AESWTPVVDF DEVLRERLAA VLGGAPVLPT GAGHDAGILA SAGVPSAMVF VRNPTGISHS 
PDEHAEMSDC HAGVAALATA LEELCRS