Gene Sros_5193 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5193
Symbol
ID	8668487
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	5709431
End bp	5710741
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	72%
IMG OID
Product	hypothetical protein
Protein accession	YP_003340711
Protein GI	271966515
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.102029
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAGTA AAAAGCCGCA CCTGGAGCGG GCGGTTGCGT TGGGCGAGGC CAGAAGGCGG 
GCGGCGGTGG CGCTGTCCGT CCTCGGCCTG CGCGCGGAGC TCGTCGACGC CGGCCGCGAC 
CGCGATCCGA CCGCCTGGTG GTGCGGGCTG CTCGACGACG CGGATTCGCC GCTCGCGTGC 
GGGATGGGGA AGGGGCGCCC GGAGGAGGCC CGGGTGGGCG CGCTGTTCGA GGCCATCGAG 
CACTACCTCA CCGGCCCGGC GGGGTTCGAC CCCGCCGTCG TGGAACCGGC CGCGCCTGCC 
CGGATCGCCG CAGGACCCCT GCGGGCGGAC GCCTCCGCGC TGTTGCTGGC CCGGATGCCC 
GGCCGGCGGA TGGCGTGCCT GCCCTATCGC CGGCTCGGCG GGGGAGGAGG GACGCTGGTG 
CCGCTGTTCC TGTCCACCCC CTGGTACGTC GAGACCGGGG CCGCACGGTT GCGTGAGCTG 
GTCGGGGACG ACTGCGACTA CGTCCACCTG ATGCGCTACA GCTGCAACAG CGGCTCGGCC 
GCCGGAGTGG CCGCCGCCGA GGCGCTGCTC CACGCACTCA ACGAGGTGAT CGAGCGGGAC 
GCCCTGTCCC TGCTTCTCGC GCGGGCCTTC CTGGGCCGGG GCGGTTTCCA GCCCAGGCTG 
ATCGACCCGG GAACGCTTCC AGCGGGCCTC GCGCGGGCAT ATGCGACCGC AGGGGAGCTG 
ACCGGATCGC CGGTGCACCT GCTGGACATC ACCAGTGATG TCGGGGTGCC GACCATGCTG 
GCGTACACGG CCCCCACTGT CCGCCATCCG CACCGGCGCG GCGCCGGGAC CTCGCTGAGC 
CCGGCCTATG CCGCCTGGCG CGCCCTCACC GAGCTCGTCC AGATCACTCT CGGTGAGAAC 
CTGTCGCATT CGGGAGCGCC CGCGCGTGGT GATCTGGCCG GGCTGGCCGC GCACCCCGCA 
CTGTACGCGT GCGGCCGGTT CGACCTCGCC GGCCCGCTGC GCCAGGCTCG GATGATCCCC 
TTCCGGACCA CCGAGGTGGC CGGGCCTCCC GGCGGCCAAC TGCGGAAAGT CGCCGCGATG 
CTGGCCGCCC GGGGCTATCC CGTCTTCCAC CGTACGGTGC GCGCCCTTCC GGCCGGGGTC 
ACCGTCGTGC ACGTGGTCGT GCCGGGTCTG GAGCGGTTCA TGCTCGTCAC CGACGGCAAC 
CTCGTGCTCC CGGGAGGTAG GGGGCAGGCC GCGGCAGCCA GCTTTTCCGA TTTATCGACC 
TTTCATATGG AATCAATATT CCCATCTTGG TGGCGAATGT GCAGACAATA G

Protein sequence

MASKKPHLER AVALGEARRR AAVALSVLGL RAELVDAGRD RDPTAWWCGL LDDADSPLAC 
GMGKGRPEEA RVGALFEAIE HYLTGPAGFD PAVVEPAAPA RIAAGPLRAD ASALLLARMP 
GRRMACLPYR RLGGGGGTLV PLFLSTPWYV ETGAARLREL VGDDCDYVHL MRYSCNSGSA 
AGVAAAEALL HALNEVIERD ALSLLLARAF LGRGGFQPRL IDPGTLPAGL ARAYATAGEL 
TGSPVHLLDI TSDVGVPTML AYTAPTVRHP HRRGAGTSLS PAYAAWRALT ELVQITLGEN 
LSHSGAPARG DLAGLAAHPA LYACGRFDLA GPLRQARMIP FRTTEVAGPP GGQLRKVAAM 
LAARGYPVFH RTVRALPAGV TVVHVVVPGL ERFMLVTDGN LVLPGGRGQA AAASFSDLST 
FHMESIFPSW WRMCRQ