Gene Sros_3197 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3197
Symbol
ID	8666485
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	3488919
End bp	3490940
Gene Length	2022 bp
Protein Length	673 aa
Translation table	11
GC content	74%
IMG OID
Product	hypothetical protein
Protein accession	YP_003338885
Protein GI	271964689
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGTGACG ATCCGGCCAT GCCCCCCGCC GTGGCGCGGG CCCTGGAGGA GTACCGGGCG 
CTGCTCGCCG AACACGGGGT GACCTGGGGC GAGGACCCCA TCCCCTACGT CAGGTCCATG 
ACCGCCGACG CCTACCTGAT GGGCACCACG ACCTTCCGGG ACGTCTGCCA GGGCATGCTC 
CGGGCCCGTT ACCCGCAGGC GTCCTCCGGC GAGCTGGCGG GGCGCTTCGC CGAGCTGGAC 
ATGGACGAGG TCGTGCGCAA CGTCCTGGCG GGCAGGGTGT CGGACAACCT CGCGGCCCTC 
CGGCTCACCG GGGAGGGCCT CGCGGTCGAG GCGCACCCGC TGGCCGTACT GGACGGCGGG 
CCCCTGCGCA CGACGCTGCT GGTCGACTCC GCCCGCGACG AGCCGGTCAC CGTGCTGGTG 
GACGGCCGGG CGCACGAGAT CGGCCCGCGC GGCGCGCGCC TCATCAAGAT CACCAGCGGG 
AGCGAGGTGA TCGCCGACGG CGGGCGCGTG GACCTCACGC CCCTGACCCG CCCCGCCGCC 
GCCGCGCGCC TGCGGCTGCG CGCCGGGTTC CCGTGCAGGT GGAGCGTGTA CGGCGAGCAG 
GGGCAGGGCT GGTACCCCGA GGGCGCCCCG GCCAGGCGCG ACTACCACGT CCTGCCCTAC 
TTCCACGGCG ACGACGTGGT GCTGGACGTC CCGGCCGAGC CGCTGACCGT GCGGGTCTCC 
AGGGGGATGG AGTACGGCTC CGCCGAGCTG GCGGTCACTC CCGCGGCCGG CGAGGAGACC 
CTGGTCGAGC TGGCGCCCGA GCGGATCTAC GACGCGGCGG CGCTGGGCTG GTACGGCGGG 
GACATGCACG CCCACCTCAA CTGGGCCGGG GACATGGTCG GCACCCCGGC GCTGGCGGCG 
GCCATGCAGC ACGGCGAGGA CCTGCACGTG CTCAACCTGG TGGCCGGGAA CGTCTCCTCC 
GAGCGCGTCT ACGACTCCGA GGCGCTGGCA CACTGGGCGG GCCGGGACCT GCCGTGGTCG 
GACGGCACCC ACCTGGCCAG GATCGGCGTC GAATACCGCA ACGACCTCCT CGGCCACCTC 
TACGCCTTCG GCGTCTCGGC GCCGCCCTCG CGCTTCCACA CCGGTTTCCT GGGCACCGCG 
GACTGGCCGC CCAACAGCGT CGCCTGCGAG GAACTGCGCG GCCTCGGCGC GCTCCTGGGC 
TACAGCCACC CGTTCCACAA CCCGATCTCC GACACCGACG GCCCCGGCCA CCTGCTGTGG 
CAGGGCCGCA ACTGCTCCTC CCGGGAGATC GTCGCCGACG CCGCCCTCGG CCTGGTGGAC 
AGCCTCGACG TGCTCAACCA CACCTCGATC GCCGCGACCG CCGCCGTCTA CCGGCACCTG 
ATCGGCGCGG GCAACCGGAT CGCGGTCACC GCGGGGACCG ACGCGATGGT CTCCTTCGCC 
CGGCGCGGCA ACCAGTCCAA CCCGCCGGGC TGGGCCCGTG TCTACGCCCG CGTCGAGGGG 
CCGCTCACCG CCGGGTCGTT CGCCGAGGCC GTCAGGCGGG GCCGTACGTT CGGCACCACC 
GGCCCCTGGC TGGAGCTGTC GGCCGGCGGG CACGGACCCG GTGCCACCCT GGACCTCTCG 
CCGGGAGAGC GGGTCACGGT CACCGCGAGG TCGGCAGGTC CCGAGGTGGA GAGGCTGGAG 
ATCCGCACCG CCGACGGCGT CCTGGCCGAG GGGCCGCCCG CCGAGCTGAC CTGCGAGCTG 
GTCGCCGGCG ACCCCACCTA CGTCGTCGCC GTGGCCGTCG GCGGGCCGCA CGAGCGCGCC 
CTCACCGGCG GCGCCTACGC CCATACCAGC CCGGTCTACC TCGACGTCGC CGGCCGTCAC 
GTGGCCAGGG AGCAGGACGT CCGCTGGTGC CTGGAGTGGC TGGACGGCAT GGAGACGCTG 
CTCCGGCGGC AGGGCACGTT CGAGACCGCC GCGCAGCTCG GCGACCACCT GGAGCTGATC 
GAGCGGGCCA GGGAGGTCTA CCGCGCCCGC CTGGGCTCAT AG

Protein sequence

MCDDPAMPPA VARALEEYRA LLAEHGVTWG EDPIPYVRSM TADAYLMGTT TFRDVCQGML 
RARYPQASSG ELAGRFAELD MDEVVRNVLA GRVSDNLAAL RLTGEGLAVE AHPLAVLDGG 
PLRTTLLVDS ARDEPVTVLV DGRAHEIGPR GARLIKITSG SEVIADGGRV DLTPLTRPAA 
AARLRLRAGF PCRWSVYGEQ GQGWYPEGAP ARRDYHVLPY FHGDDVVLDV PAEPLTVRVS 
RGMEYGSAEL AVTPAAGEET LVELAPERIY DAAALGWYGG DMHAHLNWAG DMVGTPALAA 
AMQHGEDLHV LNLVAGNVSS ERVYDSEALA HWAGRDLPWS DGTHLARIGV EYRNDLLGHL 
YAFGVSAPPS RFHTGFLGTA DWPPNSVACE ELRGLGALLG YSHPFHNPIS DTDGPGHLLW 
QGRNCSSREI VADAALGLVD SLDVLNHTSI AATAAVYRHL IGAGNRIAVT AGTDAMVSFA 
RRGNQSNPPG WARVYARVEG PLTAGSFAEA VRRGRTFGTT GPWLELSAGG HGPGATLDLS 
PGERVTVTAR SAGPEVERLE IRTADGVLAE GPPAELTCEL VAGDPTYVVA VAVGGPHERA 
LTGGAYAHTS PVYLDVAGRH VAREQDVRWC LEWLDGMETL LRRQGTFETA AQLGDHLELI 
ERAREVYRAR LGS