Gene Sros_3213 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3213
Symbol
ID	8666501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	3501734
End bp	3502888
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	73%
IMG OID
Product	hypothetical protein
Protein accession	YP_003338899
Protein GI	271964703
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0446815
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGACA GCGAACTGAC GCTCACCCCG CCCGCCCCCG TGGCCGCCGT GTCCACCACG 
GCGGCGGCGA CCATGCTCCC GCTGCCGGAC GGTCGCGAGG CCGAGCTCGG CGCGAAGGCG 
CGGCGGTTCG CCGCCGAGCT GGCCGCGCTG GACCACCGGC AGCCGGACTT CACCCGCAAG 
GTGCGCGACA TCTCCTCGAT GGGCGACGCC GAGATCCGCT CCGCCTCCCA GGCGGCCAAC 
CGGATGTTGA AGCGCCCGGT GGCCGCTTTG GCGGCGGCCC GGGGAGAGGG GGCCGACGCC 
CGGGGGCGGG TGGCGGACCG GCTCGTGGCG CTGCGCCGTA CCGTGGTGGA CCTCGACCCG 
AAGCAGGCCG CGGGCGGGCC GCGCAAGCTG CTGGGACTGA TCCCGTTCGG GGACCGGCTG 
CGCGACTACT TCGCGAAGTA CCACTCCGCC CAGAAGCACC TGGACGACAT CATCCGGGCG 
CTCCGATCCG GCCAGGACGA GCTGCTCAAG GACAACGCCG CGATCGAGGG CGAGAAGGCG 
GACCTGTGGG AGGCGATGAC GCGCCTGCAG GAGTACGCGG TGACGGCCGC CGCGCTCGAC 
GCCGCGCTGG AGGACCGCGT CCTGGCCCTC GACGCGGCCG AACCCGGGAA GGCGGCGGCG 
CTCCGCTCCG ACGCCCTGTT CACCGTACGG CAGAAGCACC AGGACATCCT CACCCAGCTC 
GCCGTCTCCG CCCAGGGCTA CCTGGCCCTC GACCTGGTCA GGAAGAACAA CCTGGAGCTC 
AGCAAGGGCG TGGACCGGGC CACCACCACG ACCGTCGCCG CGCTGCGCAC CGCCGTGACC 
GTCGCCCAGG CCCTGGCCAA CCAGAAGCTG GTGCTGGAGC AGATCACCGC GCTCAACTCC 
ACCACCGGCG ACCTGATCCT GGCCACCGGC GAGATGCTGC GCACCCAGGC CGGCGCCATC 
CAGACCCAGG CCGCCTCCAC CACGGTCGAC ATGGACGTCC TGCGCCGGGC CTTCGACAAC 
GTCTACGCCA CCATGGACAT GATCGACGGC TTCCGGTCGC AGGCCGTGGA GAGCATGGCC 
GTCACCGTGG AGAGCCTGAG CACCGAGCTC GCGCACGCCA GGACCTACCT CGACCGCGCC 
GAGGCCGCCT CGTGA

Protein sequence

MADSELTLTP PAPVAAVSTT AAATMLPLPD GREAELGAKA RRFAAELAAL DHRQPDFTRK 
VRDISSMGDA EIRSASQAAN RMLKRPVAAL AAARGEGADA RGRVADRLVA LRRTVVDLDP 
KQAAGGPRKL LGLIPFGDRL RDYFAKYHSA QKHLDDIIRA LRSGQDELLK DNAAIEGEKA 
DLWEAMTRLQ EYAVTAAALD AALEDRVLAL DAAEPGKAAA LRSDALFTVR QKHQDILTQL 
AVSAQGYLAL DLVRKNNLEL SKGVDRATTT TVAALRTAVT VAQALANQKL VLEQITALNS 
TTGDLILATG EMLRTQAGAI QTQAASTTVD MDVLRRAFDN VYATMDMIDG FRSQAVESMA 
VTVESLSTEL AHARTYLDRA EAAS