Gene Sros_3723 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3723
Symbol
ID	8667011
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	4127543
End bp	4128892
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	70%
IMG OID
Product	hypothetical protein
Protein accession	YP_003339389
Protein GI	271965193
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.788097
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.713748
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATCCAC CCCGCAGTCC AGGCCGGTTC CGCCTGGGAC TGGTCGCCGC CACGCTGGCC 
GCGCTGGTCG CCGCCGGCCT GGCGATCATC ACCCCCGCCA CCGCGGCGGA CACCCTGCTG 
TCGCAGGGCC GGCCCGCGTC GGCCTCCTCG GTCGAGGGAG GCGGGTACGG CGCCGGGGCC 
GCCTTCGACG GCAGCGGCGG CACCCGCTGG GCCAGCGCCT ACAGCGACCC GCAATGGCTC 
CAGGTCGACC TGGGCGCCAC GGCGACGGTC TCCCAGGTCG TCCTGGACTG GGAGGGCGCC 
TACGGCAGGG CCTTCAAGAT CCAGACCTCG GCCGACGGCA CGTCGTGGAC CGACATCTAC 
TCGACCACGA CCGGCACCGG CGGCAGCCAG ACCCTCAACG TCTCGGGCAG CGGCCGCTAC 
GTCCGGATGT ACGGCACCAC CCGGTCCGGC GGCTACGGCT ACTCGCTCTG GGAGTTCAAG 
GTCTACGGCA CGGGCGGCAT CGGATCCACC CCGGCCCCGA GCCCGACGTT CACCGACGCG 
GTGACGCACC ACGAGTTCCA GGCCAACTGC TCGTGGACGG CGAACCGGCC CGACGACCCG 
ATCGTCTACC CCGGCCTGCC GGGCGCCTCG CACATGCACA CCTTCGTCGG CAACACGACG 
ACCAACGCGG GCAGCACGTC GTCGTCGCTC CTCGGGGGCG GCACCTCGTG CACCAACCCC 
CACGACAGGT CGGCCTACTG GTTCCCGAGC TTCTACAAGG GCAGCCAGCT CATCCAGCCG 
ACCGGTAACC AGGTCATCTA CTACAAGTCG GGCATCCTCG AATACTGGCG GGTGCGGTCC 
TTCCCGCAGG GGCTGCGCTT CGTCGTGGGC AGCCCGACCG CGACGCTGGA GCAGTTCCGC 
GACTCTCCCG GCGCGGTCGA GGGCTTCGAG TGCGGCGACA TCTCCCACAG TTGGGACATT 
CCGACCTCGT GCCCGGCGGG CAGCCAGGTG AACGTCCGCT ACCAGGCGCC GAGCTGCTGG 
GACGGGGTCA ACCTCGACAG CGCCGACCAC AAGAGCCACA TGGCCTACCC CGTCAACGGC 
TACTGCTCCG CCGGCCACCC GGTGCCGGTG CCGATGCTCG AGTTCAAGAT CGCCTTCCCG 
GCGTCCGGCG ATCTGTCCCA GGCGCGGCTG GCCAGCGGCC GCGGCTACTC CTGGCACTAC 
GACTTCTTCA ACGCGTGGGA CAACCCCGCC ATCCTCAACG CCCTGGTCAC CCACTGCATC 
AACGGTGGCC TCCAGTGCAA CCCGCGCGGT TACGACCTGT ACAAGCCGCA CCGCGGCGCC 
GCCCTCACGG AGAACTTCGA GCTTCCCTGA

Protein sequence

MHPPRSPGRF RLGLVAATLA ALVAAGLAII TPATAADTLL SQGRPASASS VEGGGYGAGA 
AFDGSGGTRW ASAYSDPQWL QVDLGATATV SQVVLDWEGA YGRAFKIQTS ADGTSWTDIY 
STTTGTGGSQ TLNVSGSGRY VRMYGTTRSG GYGYSLWEFK VYGTGGIGST PAPSPTFTDA 
VTHHEFQANC SWTANRPDDP IVYPGLPGAS HMHTFVGNTT TNAGSTSSSL LGGGTSCTNP 
HDRSAYWFPS FYKGSQLIQP TGNQVIYYKS GILEYWRVRS FPQGLRFVVG SPTATLEQFR 
DSPGAVEGFE CGDISHSWDI PTSCPAGSQV NVRYQAPSCW DGVNLDSADH KSHMAYPVNG 
YCSAGHPVPV PMLEFKIAFP ASGDLSQARL ASGRGYSWHY DFFNAWDNPA ILNALVTHCI 
NGGLQCNPRG YDLYKPHRGA ALTENFELP