Gene Sros_5229 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5229
Symbol
ID	8668523
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	5745324
End bp	5746544
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	71%
IMG OID
Product	transporter
Protein accession	YP_003340741
Protein GI	271966545
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.276614
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACATCCG CCGACGTCTC GCCACCGGGC ACAGCCCCGG ACGCGAGCCC CTCACCGGTC 
CGGGGCTGGC TCGCGGTCCT TGCCGTGACG CTGGGAATCT TCGCCCTGAT GACCTCCGAA 
CTGCTGCCCG TCGGGCTGCT CACCCCGATC GGCACCGCAC TGGACGTCTC CGAGGGCACC 
GCCGCGCTCA TGGTCACCGT GCCCGGCCTG GTCGCCGCCG TCGCGGCACC GCTGGTCACC 
GTGGCCACCG CCAGGATCGA CCGCCGGCTG GTGCTGGCCC TGCTGATCGG TATGGTGGGC 
GCGGCCAACC TCGCCTCCGC CTCTGCCACG AGCTTCGCCG TCGTCCTCCT CGCCCGCTTC 
CTGATCGGCA TCAGCGTCGG CGGCTTCTGG TCCCTGGCCG GCGCCATGGC CCTGCGTCTG 
GTGCCGAAGC ACCATGTCGC GCGCGCCACC GCCGTCGTCT TCGGCGGCGT CGAGACCGCC 
TCCGTGCTGG GTGTGCCCGC GGGCACCCTG GTCGGTGACC TCAGCGACTG GCGGACCGCG 
TTCGCGGCCG TGGGCGTGCT CGGCCTGATC TCGCTGGCCT GCATGGTCGC CGTCATGCCG 
AAGCTGGCAC CGGAGAGCAC GATGACGTTC GCGGACCTGC CGCGGGTGTT CCGGACACAC 
CTCGCCGTGC GCGTCGGCAT CGCCATGACC TTCCTGGTCA TCACCGGGCA CTTCACCGCC 
TACACGTTCG TGCGGCCCAT CCTCCAGGAC GACGGTGTGG CGGACGGCAT GATCAGTGTG 
CTGCTGCTGG TCTTCGGGAT CGCCGGCATC TGCGGCAACT TCATCGCCGG CGCGCTGATC 
ACCAAGCGTC TCCGGCAGAC CGTGTGCGGC ATCTCCGTGC TCCTGGCCGC GGCCATGGCC 
ACCCTCGCGG TGGCCGACCA CACCACCTTC TCGGCGGCCG CGACCCTCGT CGTCTGGGGC 
CTGGGCTACG GCGCCGTCCC GGTCACCTTC CAGACCTGGA TCCTGAACGC CGCACCGACC 
GCCACCGAGG CTGCCTCCTC GCTGTACGTG TCGATGTTCA ACCTGTCGAT CGCCCTGGGC 
GCCCTTGTCG GCGGCCTGAC GGTCGACGCC GCCTCAACGG TGGGCGTGCT GTGGATCGGT 
GGAGTGCTGG CCATCCTGGT GCTGCCGATC GTCGGCGGCA GGCCTCGCGA CATGGCTCCC 
CGCCCGGCTC CGCCCGGGTG A

Protein sequence

MTSADVSPPG TAPDASPSPV RGWLAVLAVT LGIFALMTSE LLPVGLLTPI GTALDVSEGT 
AALMVTVPGL VAAVAAPLVT VATARIDRRL VLALLIGMVG AANLASASAT SFAVVLLARF 
LIGISVGGFW SLAGAMALRL VPKHHVARAT AVVFGGVETA SVLGVPAGTL VGDLSDWRTA 
FAAVGVLGLI SLACMVAVMP KLAPESTMTF ADLPRVFRTH LAVRVGIAMT FLVITGHFTA 
YTFVRPILQD DGVADGMISV LLLVFGIAGI CGNFIAGALI TKRLRQTVCG ISVLLAAAMA 
TLAVADHTTF SAAATLVVWG LGYGAVPVTF QTWILNAAPT ATEAASSLYV SMFNLSIALG 
ALVGGLTVDA ASTVGVLWIG GVLAILVLPI VGGRPRDMAP RPAPPG