Gene Sros_0834 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_0834
Symbol
ID	8664106
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	856730
End bp	857959
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	70%
IMG OID
Product	hypothetical protein
Protein accession	YP_003336591
Protein GI	271962395
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAGC AGAACGAACA GCAGATCGCG GAAGCCTTCC GGGCCGCGCC GCCCATCATC 
CTGGCTCCCG GCCCCAAGGA GTCCCCCACT CAGCTCCCGC CGCCGCCCAA CGACGTGTGG 
GACCTGCCCG GCGGCACCGC CTGGGTGTAC CACGGAGAGG GCAACCACGG CCTGACCCGG 
CCCGTCATCC TGGCGGACGG CTTCAACACG GGGCCCAGCA CCCCTGACTT CTCCTGGAAC 
GCCCTGGATT TCAACGCCTA CCCGCTCCTC AGCGAGCTGC GCCGGCGCGG CAGGGACGTC 
GTCCTGCTCG GGTTCACCGA ACGCAGCGCG TCGATCATGG ACAACTCGGA GACCGCCGTC 
GCGGCGATCC ACGAGGCGAT CGCGCGGCGA CAGGGCGAGC ATCCGCTCGC GGTCGGCGGC 
TTCAGCATGG GCGGCCTGGT CACCCGGCAT GCCCTCGCCA AGCTGGAGAC CATGAGGATG 
AACCACCAGA CAGCGCTGTA CTGGTCCTAC GACAGCCCGC ACCGGGGTGC CTGGATCCCC 
ATCGCCCTCC AGGCGTTCGC GCACTACATC CGCGCGCTCG ACAGCCGGTT CTCGGACCAG 
ATGAACAGCC CGGCCTCCCG CCAGCTGCTG GTGCAGCACA TCGCGGAGTG GCGCGACTCG 
CCCGGCGTCG ACAAGGAGCG GACCGAGTTC CTCACCGAGC TGGACCGCGT CGGCGGCTGG 
CCGCGCATAC CCCGGCTGAT CGGCGTCGCC AACGGCATCG GTTCGGGCGC CGGCAACGGT 
GTGAAGCCCG GCCTGACCGC CCTGAAGGGC AAGGGCCTGG CCATCACCGG CACCGACCTG 
CGCACCCAGC CGGCGGGCGG CGACTCGCTG GTCGCCAGGC TGCGGGTCGT GACCCTGCAG 
CGGCCGGAGA TCCACGCTCC GGGCCTCCCC GACATCGACG GCGCCCCCGG CGGCACGCTG 
GAGGGCTTCG GAATCCTCGC CGACGCGCTC AACGAGCTCG CCCGCTTCGG CTTCGGCGTC 
GACGTCCCGA TCCGCTCGCA CTGCTTCGTC CCGGCGGTCA GTGCCGTCGC CATCCGGAAC 
ATCGACTCCC GCGACGATCT GTACGTCGAC ATCGACAGCC TCTCGCCCGA GGACAGCGAA 
CTGGACGACT TCAAGCTCGC GTCCCGGAAC GAGGAGCACA CCAAGATCAC CGAGGAACTC 
TGCACCTGGA TCCTCGACCG GCTCCCGTAG

Protein sequence

MSEQNEQQIA EAFRAAPPII LAPGPKESPT QLPPPPNDVW DLPGGTAWVY HGEGNHGLTR 
PVILADGFNT GPSTPDFSWN ALDFNAYPLL SELRRRGRDV VLLGFTERSA SIMDNSETAV 
AAIHEAIARR QGEHPLAVGG FSMGGLVTRH ALAKLETMRM NHQTALYWSY DSPHRGAWIP 
IALQAFAHYI RALDSRFSDQ MNSPASRQLL VQHIAEWRDS PGVDKERTEF LTELDRVGGW 
PRIPRLIGVA NGIGSGAGNG VKPGLTALKG KGLAITGTDL RTQPAGGDSL VARLRVVTLQ 
RPEIHAPGLP DIDGAPGGTL EGFGILADAL NELARFGFGV DVPIRSHCFV PAVSAVAIRN 
IDSRDDLYVD IDSLSPEDSE LDDFKLASRN EEHTKITEEL CTWILDRLP