Gene Sros_5367 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5367
Symbol
ID	8668661
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	5879468
End bp	5880682
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	72%
IMG OID
Product	hypothetical protein
Protein accession	YP_003340873
Protein GI	271966677
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.071544
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.251798
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGATCTTG ACGTCATCCG GCGCGGCATC GACGCGCTCC GCGAGTACGA CACGGACCTC 
TGCTGCTTCG GCGCCCGCGA GCACCGCTAC CGGTTCAAGC CGCCGCTCGA CGAGGCCGCG 
TTGGCGGCCG TCGAGGCGCG GATCGGAGTG CGCTTCCCGG CCGATTACCG CACGTTCTTG 
ACACGGCTCG GCAACGGCGG CGCCGGCCCG TACTACGGGG TTCACGGGGT GCGGCCGGAC 
GGCGATTGGG CGCGGTTCCG CCCGTTCCCG TTCGCGCAGG AGTGGGAGCC GCCCGACCAG 
GACGACGAGG ACTACGACGA CGTCATGGAA GCCGCGTTCG AGGGGCTGCT GCCGGTCGCC 
GAGCATGGCT GCGGCTACCG CTCTCACCTC GTCGTCAAGG GCCCCGCCGC GGGCCAGGTC 
TGGGGCGACT GGACGTGCGT CGGTGAGGTG CTGGCCCCCG AGGCCGAGTC GTTCGGCACG 
TGGTACCACG ACTGGCTGGA GAGCTCGCTG CGGGAGGTGC TGGGTGACCG GATCACGGCA 
ACCGTGCACG ACGAGACCGG CTGGAGCGTT GACCGGCGGC TGCTCGGCCT CCTCCCGCCG 
CCGCCCGCCG GTGGCGACGC ACAGCCGGAG GTAAGGGTCC TACGGCTGCT CAGGCGGATC 
TACCCCGCCC TCTACGAACG CCGCCACGAC GACGCCCGCG ACCTCCTCGC CCAAGCCCGC 
GCGGTCGGCG CTCCGGCGGC CTACGAGGTG GGCATCGCGC TTGCGGACGC CGTGCTCCTG 
CGCGAGGAAG GCAGGATCGC CGACGCCCTG ACCACCGTGG AACATACGAT CCCGCGGTGC 
GGCTGGCCAT TCGAGAAGGC GCGGCTGCAC CGCCTGCGAG TCGAGCTGCT CCTGATGCAG 
AGCCGGCTGG ACGACGCGCG TGCGGCGACC GAGGAGCACA TCGCGCACTG CCCCGATGAC 
GACTTCGGCT ACGTACGCCG TGCCCTCCTG CTGCTGATGA CCGGCGATCT CCCAGCCGCC 
GAGAACGTCC TGCGCGCCGA CGCCCCGCTC GGGAGAGGAT TCGGATCGGT AAGCCACCCG 
TATCCCGCCG ACCGAGCCGC GACCGCGCTA CGGCTCCGTG CCCGGCGCCT GGCCTGGGAG 
TGCCGCCGCT GGGGACATCC CACCAACGCG CTCCGCTTCG ACGCGATCGC CACCAGCCAA 
TCGGCCTGTC GTTGA

Protein sequence

MDLDVIRRGI DALREYDTDL CCFGAREHRY RFKPPLDEAA LAAVEARIGV RFPADYRTFL 
TRLGNGGAGP YYGVHGVRPD GDWARFRPFP FAQEWEPPDQ DDEDYDDVME AAFEGLLPVA 
EHGCGYRSHL VVKGPAAGQV WGDWTCVGEV LAPEAESFGT WYHDWLESSL REVLGDRITA 
TVHDETGWSV DRRLLGLLPP PPAGGDAQPE VRVLRLLRRI YPALYERRHD DARDLLAQAR 
AVGAPAAYEV GIALADAVLL REEGRIADAL TTVEHTIPRC GWPFEKARLH RLRVELLLMQ 
SRLDDARAAT EEHIAHCPDD DFGYVRRALL LLMTGDLPAA ENVLRADAPL GRGFGSVSHP 
YPADRAATAL RLRARRLAWE CRRWGHPTNA LRFDAIATSQ SACR