Gene Sros_5342 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5342
Symbol
ID	8668636
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	5855810
End bp	5857081
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	71%
IMG OID
Product	hypothetical protein
Protein accession	YP_003340849
Protein GI	271966653
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.764052
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.588325
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAACCG ACCCGGCAGC GACCGCCGTC GCGGTTGTCG AGATGGCATG TGAGGGACGC 
TTCGCCGACA TCGAACGGCT CTTCACGCCC TCGCTGCGAG CGTTGGTCGG CGCCGAGGTG 
TTGCAGGCCG CCTGGACAGC CGAGATGGGC AGGCGCGGAC CGGTTGGCAC TGTCGGGGAG 
CCGGTGAGCG AGCCGGCCCA GGCGGGGCTG GTCCGTGTGA GTGTCCCGGT GGCCTGCGAG 
CACGCGGGAC TCACCGTGGT GGTGGCGGTT GACCACGACG GCATGCTGCA CGATCTGCGG 
CTTACCGCTA TCACCGCGCC CTGGACGCCT CCGCCGTACG CCGACCCGGC GAGGTTCGAC 
GAGCACGACG TCACGGTCGG CGACGGCCCT CTCGCCGTGG CCGGCACGGT GAGCCTGCCG 
CATGGGCCCG GCCCGCGAGC GGGCGTCGTG TTGCTCGGCG GGGGCGGGCC CTTCGACCGC 
GACGCCACCA GCGGAGCCAA CAAACCACTC AAGGACCTGG CCTGGGGGTT GGCCGGTCGC 
GGTGTCGCGG TGTTGCGGTT CGACAAGGTG ACCCACACCC ACAGCGAACA GGTGGCGAAC 
GCAGCCGGCT TCACGATGAC CGACGAGTAC GTGCCGCACG CGGTCGCCGC CGTCCGGCTT 
CTCCAGCGGC AGCCGGGCGT GGACCCCGCC CGCGTCTTCG TTCTCGGCCA CAGCATGGGC 
GGTAAGGTCG CGCCGCGTGT CGCGGCTGCC GAGGCGTCCG TCGCCGGTTT GGTGATCATG 
GCCGGCGATA CGCAGCCGAT GCACCAGGCC GCCATCCGCG TCATCCGTTA CCTCGCCTCG 
CTGGATCCCG GACCGGCGAC GGAGGCGGCC GTCGAGGCGT TCACGCGGCA GGCCGCGATG 
GTCGCCGGTC CCGACCTGTC ACCGTCGACG CCGACCGAGG CGCTGCTGTT CGGCTGGCCG 
GCGGCGTACT GGCTGGATCT GCGCGGCTAC GACCCGGTCG CCACCGCGGC GGCGCTGGAC 
AAGCCGATGT TCATCCTCCA GGGCGGCCGC GACTATCAAG TGACGGTGGC CGACGATCTG 
TCAGGGTGGA AGGCCGGCCT CGCTCACCGG CCGGATGTCA CGATCCGCGT CTACGACGCC 
GACAACCACC TGTTCTTTCC CGGCGCGGGT CCGTCCACGC CCGCGGAGTA CGAACCCCCG 
CAACACGTGG ACCCGGCCGT CGTCGCCGAC ATCGCGGAGT GGCTGGCGCC GGAGCACGGG 
AAGATCGCTT GA

Protein sequence

MGTDPAATAV AVVEMACEGR FADIERLFTP SLRALVGAEV LQAAWTAEMG RRGPVGTVGE 
PVSEPAQAGL VRVSVPVACE HAGLTVVVAV DHDGMLHDLR LTAITAPWTP PPYADPARFD 
EHDVTVGDGP LAVAGTVSLP HGPGPRAGVV LLGGGGPFDR DATSGANKPL KDLAWGLAGR 
GVAVLRFDKV THTHSEQVAN AAGFTMTDEY VPHAVAAVRL LQRQPGVDPA RVFVLGHSMG 
GKVAPRVAAA EASVAGLVIM AGDTQPMHQA AIRVIRYLAS LDPGPATEAA VEAFTRQAAM 
VAGPDLSPST PTEALLFGWP AAYWLDLRGY DPVATAAALD KPMFILQGGR DYQVTVADDL 
SGWKAGLAHR PDVTIRVYDA DNHLFFPGAG PSTPAEYEPP QHVDPAVVAD IAEWLAPEHG 
KIA