Gene Sros_2246 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_2246
Symbol
ID	8665528
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	2424140
End bp	2425240
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	73%
IMG OID
Product	hypothetical protein
Protein accession	YP_003337971
Protein GI	271963775
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.714223
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.357481
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAACG ACGAGATCGA GATGGTGGCC GGCCTCCGCC CGGACGTGCC GCCGTACGCC 
CCCGAGGCGA AGGGCGCGGC CCGGCGGGGG CTGGCCGCGG CCGCCAGGGG CCGCAGGCCG 
CTGTGGCGCA GGCCGTACAC GGTGATGCTG GCCGGAGCGC TCGCGGTGGC GGCCGGGGTG 
ACCGTGACGG TCACGCTCAC GGCGCCGGAG CGGGAGGTGG GCGGCACCGA GGTCGTGGTG 
GCGATGCCCG AGATCGCCCC CATGTCGGCG AGCGAGGTGC TCGGCAGGGC CGCGCGGGCC 
GCCGCGCGCG ACGACCTCGA CCCGCGCGAC GACCAGTTCG TCAAGGTCGA GTCGCAGACG 
ATGTACGGCT CGTTCTCGTT CGGAGCCTCG GGCACCGGCT CCGGCGGCGA CACGGAGTCC 
GAATCGCGGT ATCTCTACCG GAGCAAGCGG GTGATCTGGC AGTCCGCCGA CGGGACGAAG 
GACGGCGCGC TGAAGATCGA ATATCTGGAG CCGCGCGCCT ATCCCGGCTG GCCCATCCCG 
CCGAAGGCCT ACGACGACCG CGGCACCGAG TGGCACCGGC TGCCGGCCTG CGTCGGGCAG 
CCCGGCCGGA CGCGCACCGA CTACGCGAGC CTGAAGAAGC TGCCCTCCGA CGCCGAGGCG 
ATGCGCGCCC ACCTCTATAC CGGTGAGCCC GGCGACGACC TCAAGCTCAA GGCGACCGAT 
GCGCCCGGCG GAAAGTCCAG GGACGCGGCC GCGTGGACCG CCGCCGGCGA CATGCTGCGG 
GAGAACTACA TGCCTCCGGC TCAGCGTGCG GCGCTGTTCG AGGCCGTGGG GACGATCCCG 
GGGGTCGACG TCGTGCGGGA CGCCGAGGAC GCGGCGGGCC GCAGGGGCAT CGGCGTGGGC 
CGGGTCGGTC AGGCGGGCGT GCGGGAGGAT CTGATCTTCG ATTCGGAGAC CTACGAACTC 
CTGGGCGAGC GGGGCGTCGT GGTGGACGAG AAGGCGGCCG AATCACCGGC GGGCAGCCTG 
GTGGCCTCGA CCGCCCAGCT CTCCGTCACC GTGGCCGACT CCCCGCCCGA GGTGAAGGAC 
GACGCCGCCG GCTGCCTCTA G

Protein sequence

MNNDEIEMVA GLRPDVPPYA PEAKGAARRG LAAAARGRRP LWRRPYTVML AGALAVAAGV 
TVTVTLTAPE REVGGTEVVV AMPEIAPMSA SEVLGRAARA AARDDLDPRD DQFVKVESQT 
MYGSFSFGAS GTGSGGDTES ESRYLYRSKR VIWQSADGTK DGALKIEYLE PRAYPGWPIP 
PKAYDDRGTE WHRLPACVGQ PGRTRTDYAS LKKLPSDAEA MRAHLYTGEP GDDLKLKATD 
APGGKSRDAA AWTAAGDMLR ENYMPPAQRA ALFEAVGTIP GVDVVRDAED AAGRRGIGVG 
RVGQAGVRED LIFDSETYEL LGERGVVVDE KAAESPAGSL VASTAQLSVT VADSPPEVKD 
DAAGCL