Gene Sros_4249 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_4249
Symbol
ID	8667543
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	4733266
End bp	4734474
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	67%
IMG OID
Product	phage tail sheath protein FI
Protein accession	YP_003339894
Protein GI	271965698
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.408866
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.264788
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAAGTT ACCTTCGCCC CGGGATCTAC CTCGAGGAGG TGGCGTATTC GCAGGGGCCG 
AAGCCCCCGC TCCGGCAGCG GCCTCCAGAG GTCGAAGACG ACCTCGGGGG CCGGCCCAGG 
CCTCGCTGGC TACCGGAGCA TACGCACGCG GCCTTTGTCG GTTTCGCCGC GGCGGGACCT 
TTTCACCTGC CCACCTGGCT GCACAGCTGG GCACAGTTCC AGCAGAACTT CGGGGACTTC 
GCCGAGGGCT TCGCGCTGGC GCACGCGGTC TACGGATTCT TCGCCAACGG CGGGCAGGCC 
TGCGTGGTGG TGCGGGTCGG GCACGACTCC GAAGACCTGC GTGACACGTT CGTCGGAGAC 
GTCGATCACC GTACCGGTGT CGCCGCCCTG CAGCCCCTGG AGGATGTCTC GATCATCTGC 
GCGCCGGATC TGATGACCTC CTACGGACGC CGTCGCATGG ATCTCGACGC CGTCAGGGCC 
GCCCAGGTCG CGCTGATAGC CCATTGCGAG TTCAGCGGCG ACCGCATGGT CATCCTGGAC 
TGTCCCCCCG GCCTCTCCCC ACAGCAGGCC AGAGACTGGC GGATGGAGCT GACGGCCTAC 
GACAGCGCCC AGGCGGCGCT GTACTACCCG TGGATCAAGG TGTACGACCC GTTCACCGGC 
ATGAGTCGTT CCGTGCCGCC GTGCGGGCAC GTCGCCGGCG TCTACGCCAG GGTGGACCTC 
CTGCGCGGTT TCCATCACAC GCCGGCCAAC CAGTCGCTGG AGAGCGCCCG TTCGGTCGAG 
CTGGTCGTCT CCCACAGCGA GCAGGAGGTG CTGAACCCGA TCGGCGTCAA CACCCTGGTC 
ATGTCGCCCG GCCGTGGAGT CGTGGTCTGG GGCAGTCGCA CGCTGAGCAG CAATCCCGAC 
TGGCGCTACA TCCACCGTCG CCGGGTGGTC AACTTCATCC TCCGCAACAT TCGCAGGGGA 
ACCGAGTGGG CGATCTTCGA ACGACCGGAC GACCTCAGCC TGCGTCCGCG CATCGCCGCG 
GACATCAGGG ACTTCCTGCA CCTGCTGTGG CGCAGCGGGG CACTGTGGGG GGACACCCCT 
GAAGACGCCT TCTGGGTGAG CTACGACAGC GGCCCGTTCG GCGACGACAG AAGCGTGTAC 
ATCGACTGCA CCATCGAGCT GGAGGATGGT TTCACGTCCA GTTTCCGCCT GCTGTACTTC 
TGCGACTAG

Protein sequence

MPSYLRPGIY LEEVAYSQGP KPPLRQRPPE VEDDLGGRPR PRWLPEHTHA AFVGFAAAGP 
FHLPTWLHSW AQFQQNFGDF AEGFALAHAV YGFFANGGQA CVVVRVGHDS EDLRDTFVGD 
VDHRTGVAAL QPLEDVSIIC APDLMTSYGR RRMDLDAVRA AQVALIAHCE FSGDRMVILD 
CPPGLSPQQA RDWRMELTAY DSAQAALYYP WIKVYDPFTG MSRSVPPCGH VAGVYARVDL 
LRGFHHTPAN QSLESARSVE LVVSHSEQEV LNPIGVNTLV MSPGRGVVVW GSRTLSSNPD 
WRYIHRRRVV NFILRNIRRG TEWAIFERPD DLSLRPRIAA DIRDFLHLLW RSGALWGDTP 
EDAFWVSYDS GPFGDDRSVY IDCTIELEDG FTSSFRLLYF CD