Gene Sros_5947 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5947
Symbol
ID	8669241
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	6518284
End bp	6519471
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	69%
IMG OID
Product	hypothetical protein
Protein accession	YP_003341425
Protein GI	271967229
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.9215
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0109632
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGTACA ACGAGGTGAT GGGTGGCCGC GCGCCGATCC GCATGTGGGC CGACCCGGCC 
GAGGTCGAGC CCGAGGTGAT GCAGCAGCTG CGCAACGTCG CGAACCTGCC GTGGGTGCAG 
GGCGTCGCCG TGATGCCGGA CGTGCACCAC GGGATGGGCG CGACGGTGGG GTCGGTCATC 
GCGATGCGGG ACGCGGTCTC GCCGGCGGCG GTGGGTGTGG ACATCGGGTG CGGGATGACC 
GCGGTGAAGA CCTCGTTCAG GGCCGCCAAC CTGCCCGACA ACCTCGCCTA CCTGCGCTCG 
AAGCTGGAGC AGGCGGTCCC CGTCGGGTTC GGTCACCACA AGAGGCCGGT CGACCCGACC 
AGGCTGCACG GGATGAAGAC CGCCGACTGG GCGGGCTTCT GGAAGGACTT CGACACCCTG 
GCCCCGGCCG TGCGCCCGAA GCGGGAGCGC GCCGAGGTGC AGATGGGCAC CCTGGGCGGA 
GGCAACCACT TCCTGGAGGT CTGCGCCGAC GACGAGGGCG TGGTCTGGGT CGTGCTGCAC 
TCCGGATCGC GCAACATCGG CAAGGAGCTG GCCGAGTTCC ACATCGGGCA GGCCCAGAAG 
CTGCCGCACA ACCAGGACCT GCCCGACCGG AACCTCGCGG TGTTCGTCGG GGGCACGCCG 
CAGATGGACG CCTACCGGCG GGACCTGTTC TGGGCGCAGG ACTACGCGCG GCGCAACCGG 
GCGGTCATGA TGGCCCTGGT CTGCGACGTG CTCAGGCGTC ACCTGTCGGG CATCACCTTC 
GAACAGCCGA TCTCCTGCCA CCACAACTAC GTGGCCGAGG AGCGGTACGA CGACGTGGAT 
GTGCTCGTCA CCCGCAAGGG CGCGATCCGC GCGGGATCCG GCGAGTTCGG CATCATCCCC 
GGCTCGATGG CGACCGGCAC CTACATCGTG AAGGGCCGGG GGAACGCCGG TGCGTTCAAC 
TCGGCCTCAC ACGGTGCCGG TCGCCGGATG AGCCGGAGCA AGGCCAAGAA GACCTTCACG 
CTGGCGGACT TCAAGGCGCA GACCGACGGC GTCGAGTGCC GCAAGGACAC CGGGGTGATC 
GACGAGATCC CCGGCGCCTA CAAGGACATC CGGTCGGTCA TGGCGGCCCA GGCCGACCTG 
GTCGAGGTGG TCGCCCGCCT CCGGCAGCTC ATCTGCATCA AGGGCTGA

Protein sequence

MTYNEVMGGR APIRMWADPA EVEPEVMQQL RNVANLPWVQ GVAVMPDVHH GMGATVGSVI 
AMRDAVSPAA VGVDIGCGMT AVKTSFRAAN LPDNLAYLRS KLEQAVPVGF GHHKRPVDPT 
RLHGMKTADW AGFWKDFDTL APAVRPKRER AEVQMGTLGG GNHFLEVCAD DEGVVWVVLH 
SGSRNIGKEL AEFHIGQAQK LPHNQDLPDR NLAVFVGGTP QMDAYRRDLF WAQDYARRNR 
AVMMALVCDV LRRHLSGITF EQPISCHHNY VAEERYDDVD VLVTRKGAIR AGSGEFGIIP 
GSMATGTYIV KGRGNAGAFN SASHGAGRRM SRSKAKKTFT LADFKAQTDG VECRKDTGVI 
DEIPGAYKDI RSVMAAQADL VEVVARLRQL ICIKG