Gene Sros_8074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_8074
Symbol
ID	8671402
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	8894226
End bp	8895716
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	72%
IMG OID
Product	Amidase
Protein accession	YP_003343472
Protein GI	271969276
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.148196
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTCA TCCACAAGTC CGCCGCCGAA CTGGGCGCGC TGGTCGCAGG CGGAGAGGTC 
TCGGCCGTCG AGGTGGCCCA GGCCCACCTC GACCGGATCG CCGCCGTCGA ACCGCAGGTC 
AACGCCTTCC TGCACGTCGA CGCCGAGACG ACGCTGGGGC AGGCACGCGC CGTCGACGCC 
CGCAGGGCCG CCGGGGAGGA CCTCGGCCCG CTCGCCGGTG TGCCGATCGC GCACAAGGAC 
GTCTTCACCA CCGTCGACAT GCCGACCACG GCCGGATCCA AGATCCTTGA GGGCTACCGC 
CCGCCGTACG ACGCCACCGT GACCCGCCGC CTGCGCGAGG CCGGACTGGT GATCCTCGGC 
AAGACCAACC TCGACGAGTT CGCGATGGGC TCCTCCACGG AGAACTCGGC CTACGGTCCC 
ACCCGCAACC CGTGGGACCT GAGCCGCATC CCGGGCGGCT CCTCCGGCGG CTCGTCCGCC 
GCGGTCGCGG CCTACGAGGC CCCGCTGTCC ACCGGCACCG ACACCGGCGG CTCGATCCGC 
CAGCCCGCCG CGGTCACCGG CATCGTCGGC ATGAAGCCGA CCTACGGCGG CTCGTCCCGC 
TACGGCCTGA TCGCCTTCGC GAGCTCCCTG GACACGCCGG GCCCCTTCGC CCGCAACGTC 
ATGGACGCGG CGCTCCTGCA CGAGGCGTTC TCCGGACACG ACGCCATGGA CTCCACCTCC 
ATCGACGCCC CGGTGCCCTC CGTCGTCGAG GCGGCGCGCA ACGGCGACGT GGCCGGGCTG 
CGCATCGGCG TGGTCAAGGA GTTCGGCGGC GACGGCTACC AGGCGGGCGT GCTCGCCCGC 
TTCCACGAGA CCGTCGAGCT GCTGGAGTCC CTCGGCGCCA AGGTCGTCGA GGTCTCCTGC 
CCGTCGTTCA GCACGGCCCT GCCGGCCTAC TACCTGATCG CCCCGTCGGA GGCCTCCTCC 
AACCTGGCCC GTTTCGACGC CATGCGCTAC GGCCTGCGCG TCGGCGACGA CGGCACGCGG 
AGCGCCGAGG AGGTCATGGC GCTGACCCGG GCCGCCGGTT TCGGCCCCGA GGTCAAGCGG 
CGCATCATCC TGGGCACCTA CGCGCTGTCC AGCGGCTACT ACGACGCCTA CTACGGCCAG 
GCGCAGAAGG TCCGCACGCT GATCGCGCGT GACTTCGAGG CGGCCTTCCA CCAGGTGGAC 
GTGCTCGTCT CGCCGACCAC GCCGACCACG GCGTTCCCGA TCGGCGAGCG GGCCGACGAC 
CCCATGGCGA TGTACCTCGC CGACCTGTGC ACCATCCCGA CCAATCTGGC GGGCAACGCG 
GCCATCTCGG TGCCGTGCGG CCTGGCCGAC GAGGACGGCC TGCCGGTCGG CCTGCAGGTC 
ATGGCTCCGG TGCTCGGCGA CGACCGCTGC TACCGGGTCG GCGCCGCGGT GGAGAGGGCT 
CTCGAAGGCC GCTGGGGCGG CAGCCTGCTG TCCAAGGCCC CGGCGCTGTA G

Protein sequence

MSLIHKSAAE LGALVAGGEV SAVEVAQAHL DRIAAVEPQV NAFLHVDAET TLGQARAVDA 
RRAAGEDLGP LAGVPIAHKD VFTTVDMPTT AGSKILEGYR PPYDATVTRR LREAGLVILG 
KTNLDEFAMG SSTENSAYGP TRNPWDLSRI PGGSSGGSSA AVAAYEAPLS TGTDTGGSIR 
QPAAVTGIVG MKPTYGGSSR YGLIAFASSL DTPGPFARNV MDAALLHEAF SGHDAMDSTS 
IDAPVPSVVE AARNGDVAGL RIGVVKEFGG DGYQAGVLAR FHETVELLES LGAKVVEVSC 
PSFSTALPAY YLIAPSEASS NLARFDAMRY GLRVGDDGTR SAEEVMALTR AAGFGPEVKR 
RIILGTYALS SGYYDAYYGQ AQKVRTLIAR DFEAAFHQVD VLVSPTTPTT AFPIGERADD 
PMAMYLADLC TIPTNLAGNA AISVPCGLAD EDGLPVGLQV MAPVLGDDRC YRVGAAVERA 
LEGRWGGSLL SKAPAL