Gene Sros_7222 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_7222
Symbol
ID	8670534
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	7973815
End bp	7975062
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	74%
IMG OID
Product	serine (or cysteine) proteinase inhibitor, clade B (ovalbumin), member
Protein accession	YP_003342655
Protein GI	271968459
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.946745
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.324248
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTCGTC TGTTCACCGC CCTGCTGGCC GTCGCCGCCC TCGCCGCCTG CGGTACGCCG 
CAGGCCCGCG TGATCACCGC CGAGGGGGTC GGGCGGGAGA CGCCGACGGA GCCCCCGGTC 
GAGGAGACCG TGCGCGGGCT GACCGCGTTC GGCCACGCCC TGTTCACCGC GGCCGCCAGG 
CCCGGCGCCA ACACCGTCCT GTCCCCGCTG AGCATCGGCC ACGCCTACGG GATGGCCAGG 
GCGGGCGCGG GCGGCAGGAC GGGACCGGAG CTGGACGAGG TCTTCGGCTT CCCCGCGGAG 
GGACCGCACA CCTCGTTCAA CGCCCTCACC CGGCAGATCG TCACGCTCGA CGGCCCGCCG 
CCCGCGCCCG CCCCGGACGC CCGGCGGGAC GCGCAGGAGA GCGAGCCGGC CGCGCCGGTC 
GTCGGCGTGG CCAACGGGCT GTTCACCCAG GAGGGGCTGA GCGTCAGGCC GGAGTTCCTG 
CGCACGCTCG CCGCGCAGTA CGGCGCCGGC GTGCGGCAGG TGGACTTCAC CGAGGACGCC 
GCCGGGGTCA TCGACGCGTG GGCGGACAGG CAGACCGCCG GGCGGATCAA GAAGGTGTTC 
GACCGGCTGG ATCCGGGGAC CAAGCTGGTC ATCGCCAACG CCGTCTACCT CAAGGCCGAG 
TGGGCGACGG CGTTCACCGA CCCGCCGGAG GAGAACGCCG CCTTCACCCG CGCCGACGGG 
ACGGCCGTAC GGACGACCCT GATGCGCCAG ATGGGGACCT TCGGCTACGC CTCCGGGGCG 
GGCTGGCAGG CCGTCGAGCT CCGCTACGCC AAGAGCGACC TGGCCATGTG GGTCCTCCTG 
CCGCGTGCGG GCGGGTCCCC CGCCGCCCTG CTCGCCCCGG CCGTGATGGC GGAGGTGGCC 
ACCGGGCTCA GGGAGACCTC CGTCAAGATC GTCATGCCCC GGTGGGACTT CTCCACGGCC 
CTGAGCCTGC AGGAGCCTCT GCGGAGGCTC GGGCTGGAAG GCTCCGACTA CTCCGGCATC 
GCCGACGGCG CGTTCCTCGG CCAGGCGACG CACCGCGCCA CCATCACCGT GGACGAGTGG 
GGCACCGAGG CCGCCGCCGT CACCGGCCTC GCCTTCCCCG TGATGGCCAT GCCCTCGCCC 
GAGGCCGAGA TCCGCGCCGA CCACCCGTTC GCCTTCGCGA TCGTCCACCG GCCGACGCTG 
ACCCCGCTGT TCGTCGGCCA GGTCGCCGAT CCGACCGCCA AGGACTGA

Protein sequence

MRRLFTALLA VAALAACGTP QARVITAEGV GRETPTEPPV EETVRGLTAF GHALFTAAAR 
PGANTVLSPL SIGHAYGMAR AGAGGRTGPE LDEVFGFPAE GPHTSFNALT RQIVTLDGPP 
PAPAPDARRD AQESEPAAPV VGVANGLFTQ EGLSVRPEFL RTLAAQYGAG VRQVDFTEDA 
AGVIDAWADR QTAGRIKKVF DRLDPGTKLV IANAVYLKAE WATAFTDPPE ENAAFTRADG 
TAVRTTLMRQ MGTFGYASGA GWQAVELRYA KSDLAMWVLL PRAGGSPAAL LAPAVMAEVA 
TGLRETSVKI VMPRWDFSTA LSLQEPLRRL GLEGSDYSGI ADGAFLGQAT HRATITVDEW 
GTEAAAVTGL AFPVMAMPSP EAEIRADHPF AFAIVHRPTL TPLFVGQVAD PTAKD