Gene Sros_4031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_4031
Symbol
ID	8667325
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	4488297
End bp	4489619
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	75%
IMG OID
Product	Lantibiotic modifying protein-like protein
Protein accession	YP_003339682
Protein GI	271965486
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0304632
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0724238
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCCGG AACCGGGGGC AGAGAGCCCC CTGCGCACCG CCGTCATGGC CGCGCGCTGG 
ATCCGTTCCG CGGCCGTGGA CGACGGGCAG GGGCGGCACT GGCGGGCCAA CCCCGACGTG 
CGGGGCCGAT CCGCCCTGCC CGGCCAGCCG CTGTCGCTGT ACTCCGGGGC GGCCGGCATC 
GTCCTGTTCT TCCTCGAACT CGCCGCCGCC ACCGGAGACG AGAGCTACTT CGACGACGCC 
GTGGCCGGAG CGCGCTACCT CGCCGCCACC TGGCGGGAGC AGGCCGACCT CTCCCTCCAC 
CACGGCCTGG CGGGAGTGAT GTTCGCGCTC GCCGAGGCGG GCTGGGCCAC CGGCGAGAGC 
TCCTTCGAGG TCGAGGCCGG GGCCGTCGCC GACCACATCG TGCGCAGCGC CCGTCCCGTC 
GACGGGGGCC TCGGCTGGAC CGGCGACCCC GCGCAGCGCG GCGACGGCGG CATCATCCTC 
GGGCTCCTGC ACGCCGCGGG CATCCTGGGC GTCCCCGCCT ACCAGGAGAT CGCCGTCGAG 
GCGGGCGCGC GCATCGCCGA GCTCGCCGTG CCCGGCCACC GGTTCGGTGA CGGAGCCTGC 
GCCGACCTGC CGCTGGACGC GGTCACGCCC GGCTTCCTGT CCGGTACGGC GGGCACCGCC 
TTCCTGCTCG CCCGCCTGTA CGGCCTGACC GGGCAGACCG GTTTCCTGAA GGCCGCCAGG 
AGAGGGGCCG ACTTCGTCCG CGCGATCAGC GTCGTGACCG AGCGGTGCGC GATGGTCCCC 
CACCACATCC CGCAGGGCCG TGACCTGCAC TACCTGGGAT TCTGCTCGGG CTCCGCCGGG 
GTCGCGCGCA TGTTCTACGA GCTGTACCGG GTGGCGGGCG ACGCCGGAGA CCTCGACTGG 
GTGGAGCGGC TGGCGCGGGG GATCGTCCGC AGCGGCACCC CCGGCCGCCA GACGGACGGC 
CACTGGAACG TGGCGTGCCA GTGCTGCGGC ACGGCCGGCC TGGTGGAGCT GTTCGTCGGC 
CTCTGGGCGG CGACCGGCCG CCAGACCCAC CTGGAGTTCG CCCACGAGCT GGGAGTGAAC 
CTGATCGGCC GGGCCACCCG GCACGGCGAG CAGGGCTCCC GGTGGTACCA GGCGTACCGC 
CGGCTGCGGC CCTGGGAGGT CACCGCCGAC ACCGGATACA TGATCGGCGC GGCGGGGATC 
GGGGCGGCGC TGCTCCACCT GGACGCCACC ACCCGCCCGC AGGAGGTGCG GCGGCTCATG 
CTGCCCCCGG ACAACCCGTT CCCGGCCATC CCGTTGCCCA CGGCGACGCT CCGCCGCACC 
TGA

Protein sequence

MSPEPGAESP LRTAVMAARW IRSAAVDDGQ GRHWRANPDV RGRSALPGQP LSLYSGAAGI 
VLFFLELAAA TGDESYFDDA VAGARYLAAT WREQADLSLH HGLAGVMFAL AEAGWATGES 
SFEVEAGAVA DHIVRSARPV DGGLGWTGDP AQRGDGGIIL GLLHAAGILG VPAYQEIAVE 
AGARIAELAV PGHRFGDGAC ADLPLDAVTP GFLSGTAGTA FLLARLYGLT GQTGFLKAAR 
RGADFVRAIS VVTERCAMVP HHIPQGRDLH YLGFCSGSAG VARMFYELYR VAGDAGDLDW 
VERLARGIVR SGTPGRQTDG HWNVACQCCG TAGLVELFVG LWAATGRQTH LEFAHELGVN 
LIGRATRHGE QGSRWYQAYR RLRPWEVTAD TGYMIGAAGI GAALLHLDAT TRPQEVRRLM 
LPPDNPFPAI PLPTATLRRT