Gene Sros_1049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1049
Symbol
ID	8664323
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	1065734
End bp	1067020
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	73%
IMG OID
Product	hypothetical protein
Protein accession	YP_003336792
Protein GI	271962596
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0105777
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCTCCT TTCTACGTGG ACCCGGCGCA CACGTGAACC GCCTGGCCAC GACTCTCTAC 
GGCTACACGT TCCTGAACGA CTTCATCCTG CTCTACCCGG TCTACGCACT GCTGTTCGTC 
GACACGGGCC TGTCGACCGC CGAGATCTCC TCGCTGTTCG TGATCTGGTC GGTCACCTCC 
CTGGTGCTGG AGGTGCCCTC CGGCGTATGG GCCGACGCCG TCTCGCGGCG GCTGCTCCTC 
ACCCTGGCGC CGCTGCTGGC CGCCGCCGGC TACGCCCTGT GGATCATCGC TCCCTCCTAC 
TGGGCGTTCG CCGCCGGCTT CGTGCTCTGG GGCGCGGCGG GAGCGCTGCA GTCGGGCGCC 
ATGGAAGCGC TCGTCTACAC CGAGCTCGAC CGCCTGGGCG CCGCCGGCCG CTACGCCACG 
ATCATGGGTC GTGGCCGCGC GCTCGGCACC GGCGCCACCA TGGTGGCCAC GGCCGCCGCC 
GCCCCCGCGC TGGCCGTGGG CGGCTACCCG ATGCTCGGGG CGGCCAGCGT CCTGGCATGC 
CTGCTCTGCG CGGCCGTCGC GACGACCTTC CCCGAGCACC GGGTGGAGAG CACGGAGAGC 
CCGGAGGAGA CGCCGCCGGG CGGCTACGCC GCCATCCTGC GGGAAGGCGT GCGGGAGATG 
CGCTCCAGCC GATCGGTACG GCGGGCGGTA CTGCTGCTGG CCGTGGTGTG GGCGGTCTGG 
GGCTCGCTTG AGGAGTACGT CGCCCTGCTC GCGGCCGCCA CCGGCGTCGT CGCGTACGCC 
GTACCGCTCC TGGTGCTTCT CGTCTCGGCG GGGGTCGCGC TCGGCGGCGT GCTCGCGACG 
ACCGGGCGGC GTCTCACGGA CCGGGCGTTC GCCGGAATCC TCGCCGCCGG GGCGCTGGCG 
CTCGGCGCGG GAGCGATCAG TGGGGTCCCG GCGGGATTCG CCGCGATCGC GGTGGCCTTC 
TGCCTATTCG AGATGGCGAC AGTGCTGGCC GGCGCGCGGC TCCAGGACCG CATCACCGGT 
CCGGCCCGTG CCACGGTGAC CTCGCTGGCC GGACTGGGCA CGGATGTGGC GGGCATCCTC 
GTCTACGGCG GCTACGCCGC GGCTTCCACG GTGGCCGGGC ACGACGTGAT CTTCGCCGTT 
TTCGCCGTGC CGTACCTCGT CCTCGCGCTG GCCCTGACCC GCGGCGGCGG GCCGCGCTCC 
GGCGGTGAGC GGCGCCGGGA GCGACGGGCG TCCGGCGGGA GGGGCGCATC CCCCGACCCG 
GCACCTCCCG TCGGACGATT TTCATGA

Protein sequence

MISFLRGPGA HVNRLATTLY GYTFLNDFIL LYPVYALLFV DTGLSTAEIS SLFVIWSVTS 
LVLEVPSGVW ADAVSRRLLL TLAPLLAAAG YALWIIAPSY WAFAAGFVLW GAAGALQSGA 
MEALVYTELD RLGAAGRYAT IMGRGRALGT GATMVATAAA APALAVGGYP MLGAASVLAC 
LLCAAVATTF PEHRVESTES PEETPPGGYA AILREGVREM RSSRSVRRAV LLLAVVWAVW 
GSLEEYVALL AAATGVVAYA VPLLVLLVSA GVALGGVLAT TGRRLTDRAF AGILAAGALA 
LGAGAISGVP AGFAAIAVAF CLFEMATVLA GARLQDRITG PARATVTSLA GLGTDVAGIL 
VYGGYAAAST VAGHDVIFAV FAVPYLVLAL ALTRGGGPRS GGERRRERRA SGGRGASPDP 
APPVGRFS