Gene Sros_3902 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3902
Symbol
ID	8667192
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	4346974
End bp	4348089
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	74%
IMG OID
Product	hypothetical protein
Protein accession	YP_003339562
Protein GI	271965366
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.165433
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.54089
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGGAA ACGGATCGAT CGGGCGTGTC CTCGTGGGCG GGCTGGCTCT GGCCGCCGCC 
GGATGGGCGC TGAAGGACAT CCCGGCGGAA CTGGGCGGCC GGGCCACAGG AGAGCGGCTG 
GCCCGGATGC TGCGCTCCCC GCGCTTCCAC GACGGCGTCT TCCACAATCC CGTGCCCGGC 
TCCTACACGC CGCCGGTGAG CAGCGTCCCG GCGATGCTCC GGGAGCTGAT CTTCGATCGT 
GACGGGCGGA AGCCGGGCGG GCCGATCCCG CTGGTGACCT CCCCGGCCAC CCCGCCGTCC 
GCGGGCGGGC TGAGCGTCGT CTGGTACGGC CACGCCACCA CGCTGGTGGA GATCGAGGGA 
CGCCGCGTGC TGTTCGATCC CGTGTGGAGC GAGCGCGCGT CGCCCTCGCG GCTCGTCGGC 
CCGCGGCGGC TGCACCCGCT GCCGGCTCCG CTGGCCGACC TCCCGGTCCT CGACGCGATC 
GTGATCTCCC ATGACCACTA CGACCACCTC GACAGGGCCA CGGTCCGCGC GCTGACCGCC 
CTCCAGAGCG CCCCCTTCCT GGTCCCGCTG GGCATCGGCG CCCATCTGGA GCGCTGGGGC 
GTGCCCGCCT CGCGGATCGT CGAGCTCGAC TGGGAGGAGG AGGCGACCGT CGCCGGACTG 
CGGTTCGTCG CCACCGCCGC CCGGCACTTC TCCGGGCGCG CCCTCACCCG CAACACCACC 
CTCTGGGGCT CATGGGTTGT CGCGGGGCGG ACCAGGCGGG TCTTCTACGC GGGAGACTCC 
GGCTACTTCG ACGGATACGC CGGCATCGGC GCCGCGCACG GCCCGTTCGA CCTCACGCTG 
ATGCCGATCG GCGCCTACAG CCCCGCCTGG CCCGACATCC ACATGGATCC CGAGGAGGCG 
ATCGACGCGC ACCTCGACCT GGGCGGCAGG CTGCTCCTGC CGGTGCACTG GGCGACCTTC 
ACCCTGGCCG TCCACCCGTG GGCCGAGCCC GTCGACCGGC TCCGGCACGA GGCCAAGGCC 
CGCGGCGTCC GGCTCGCGGT GCCCCGGCCC GGTGATCGCG TCGATACCGA CGACGTCCCC 
CTGCTGGACG GCTGGTGGGA GCTGCTCGGC ATCTGA

Protein sequence

MAGNGSIGRV LVGGLALAAA GWALKDIPAE LGGRATGERL ARMLRSPRFH DGVFHNPVPG 
SYTPPVSSVP AMLRELIFDR DGRKPGGPIP LVTSPATPPS AGGLSVVWYG HATTLVEIEG 
RRVLFDPVWS ERASPSRLVG PRRLHPLPAP LADLPVLDAI VISHDHYDHL DRATVRALTA 
LQSAPFLVPL GIGAHLERWG VPASRIVELD WEEEATVAGL RFVATAARHF SGRALTRNTT 
LWGSWVVAGR TRRVFYAGDS GYFDGYAGIG AAHGPFDLTL MPIGAYSPAW PDIHMDPEEA 
IDAHLDLGGR LLLPVHWATF TLAVHPWAEP VDRLRHEAKA RGVRLAVPRP GDRVDTDDVP 
LLDGWWELLG I