Gene Sros_8297 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_8297
Symbol
ID	8671625
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	9160210
End bp	9161568
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	72%
IMG OID
Product	hypothetical protein
Protein accession	YP_003343688
Protein GI	271969492
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.512635
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACGCG AGCCCAACCG ACTGCTTCAG CGACTCATCG CTGAAGCGGG TTTCACGCAC 
AAGGGGCTGT CCCGCAGGCT CAACGATCTC GGTGTGGTCC GGGGCCTGCC GGGTCTGAAG 
TATGACCACA GTTCCGTTCT GCGCTGGATC GGCGGCCAAC GGCCGAGAAA TCCGGTGCCG 
GGACTGCTCG CAGAGATTTT CGCACACCGG CTCGGCAGGA CGGTCAGCTC GGAAGACCTC 
GGTCTGCCGG TCGTCGCGAC ACCTCCCGAC CTCGGACAGG AGTTCACACA CACGTGGCAG 
GAGGGGATCG CGACCGTGAC GGCACTGTGG CGGGGAGATG TTGAGAGACG CAGGTTCCTG 
ATCGACTCGA CCTTCGCGAT CGGGGCCGGG GCCACCGGCG CCTTGCGCTG GCTGACCCTT 
CCCCTGGAGG GCCGTCCCGT CGCGGGCGGC GCCCGGCGGG TGGGCATGGC CGACATCGCC 
GCGATCCGGG AGGTCACCCG GTCCTTCGGC GAGCTGGACA ACAGGTTCGG CGGCGGCAGG 
GTCCGCTCGG CCGTCGTGAA ATATCTGGAC ACGGCGGTCG CGCCGCTGCT CAGCGAGGGC 
TCCTACGGCG AGGGCACCGG CAGGGCGCTG GCGTCCGCCG CGGCCGAGCT GACCCGGCTG 
GCCGGGTGGA TGGCCTACGA CCTGGAGCAG CACGGTCTGG CCCAGCGCTA CCTGATCCAG 
GCGCTGCGCC TGGCCCGGGG GGCGGGGGAC CACGGGCTCG GCGGGGAGAT CCTCGCCGGG 
ATGAGCCATC AGGCCCTATA TATAGGACAG CCGGCCCACG CTCTCGACCT GGCGCGGGCC 
GCCCAGCTGT CGGCCCGCCG CGCCGGGGTC TACGCCCTGC TGGCGGAGTC GCACGTGCTG 
GAGGCCCACG GCCACGCCCT GATGGACGAC CGGGGAGCGT GCGCCAACTC CCTGCATGCG 
GCCGAGCTGG CCTTCGACCA GCGCGAGGCC GGTGAGGAGC CCGACTGGAT CGCCTACTTC 
GACGAGGCGT ACCTGTCGGC CAAGTTCGCC CACTGCTTCC GCGATCTGGG CGACGGGCCG 
GGCACCGTAC GGCACGCGAC GCGGTCGCTG GACATGGACG GGCGCTACGT CCGCGGCCGC 
ATGTTCAACC TCTCGCTGCT GTCGGCGGGG CTGCTCGGGT GCGGCGAGCT GGAGCAGGCC 
TGCGTGGCGG CCGGCCAGGC GCTGGAGCTG GCCGGGGGGC TGCAGTCGGC CCGGACCCAG 
TCGTACGCGT CCGACCTGCG GCGGCGGCTG GACCCCTTCG CCGGCGAGCC CGCCGTGAGG 
GAGCTGAACG AGCGGGCCAG GGAGCTGAGC CCCGCCTGA

Protein sequence

MEREPNRLLQ RLIAEAGFTH KGLSRRLNDL GVVRGLPGLK YDHSSVLRWI GGQRPRNPVP 
GLLAEIFAHR LGRTVSSEDL GLPVVATPPD LGQEFTHTWQ EGIATVTALW RGDVERRRFL 
IDSTFAIGAG ATGALRWLTL PLEGRPVAGG ARRVGMADIA AIREVTRSFG ELDNRFGGGR 
VRSAVVKYLD TAVAPLLSEG SYGEGTGRAL ASAAAELTRL AGWMAYDLEQ HGLAQRYLIQ 
ALRLARGAGD HGLGGEILAG MSHQALYIGQ PAHALDLARA AQLSARRAGV YALLAESHVL 
EAHGHALMDD RGACANSLHA AELAFDQREA GEEPDWIAYF DEAYLSAKFA HCFRDLGDGP 
GTVRHATRSL DMDGRYVRGR MFNLSLLSAG LLGCGELEQA CVAAGQALEL AGGLQSARTQ 
SYASDLRRRL DPFAGEPAVR ELNERARELS PA