Gene Sros_4221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_4221
Symbol
ID	8667515
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	4703696
End bp	4704919
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	74%
IMG OID
Product	hypothetical protein
Protein accession	YP_003339866
Protein GI	271965670
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.263447
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.00109479
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCGATTT CCGCGCGAAC CGTACCCACC GGGAAAGTGA TCGCAGGGCT GGCGGTGGCG 
GCCGCCCTCG TGGCGCCGGC CGGGACACCG GCCCTGGCCC GGTCCTCGGA CGAGGCCGCC 
ACCCTGACGC TGCCCGCCCC GACCGGGAGG TATCCCGTCG GCACGGTCTC GCTGCACCTG 
GTGGACCGGT CACGCCCCGA TCCCTGGGTG GCGTCCCCGC CGTACCGCGA GCTCATGGTG 
AGCGTCTGGT ATCCGGCGAG AAGATCGCCG AACCTGCCGG TGGCGCCGCA CATGTCACCG 
CGCGCGGCGG AGGACTTCGG CGGGACTCTC GCGGCCGCGC TGTTCGGCAC CGAACCCGGC 
GAGGTGGACT GGGCCGCGAC GGAGACGCAC GCCAGGGCGG GCGCCCCGGT GAGCCGGAGG 
GCGGGAAGGC TGCCGGTCGT GCTGTTCTCG CCCGGGTTCG GCGCCCCGCG GTCGGTCGGG 
ACCACGGTGA TCGAGGACCT GGCCGGCCGG GGGTACGTCG TGGTCAGCGT CGACCACACC 
TACGAGGCCG CGCAGGTGGA GTTCCCCGGT GGCCGGCTCG AAAGGAGCAC GTTCCCGCCT 
CAGCCCACAC AGGACGCCAT GAACAAGGCA CTGGAGGTAC GGGTCGCGGA CACGCGGTTC 
GTCCTCGACC AGCTGGCCGG CCTCGACCGG GGGCACAACC CCGACGCGGG ACGGCGCCCG 
CTCCCTGAGG GGCTGCGCGG CGGCCTGGAC CTGTCCCGCG TCGGGATGTT CGGCCACTCC 
ATGGGGGGCG CCACGGCGGC ACAGGTCGTC CACGACGATC GGCGCGTCGA CGCGGGCGTC 
AACCTCGACG GCGGACACCG CGGAGCGGTC GCCCGGACCG GGCTGGCCAA GCCGTTCCTG 
CAGGTGGCGG CCGAGCCGCA CACCCGCGCC GGCGACCCCA CGTGGCGGTC CTTCTGGGAC 
GGCTCGAAGG GCTGGAAGCG GGAGCTGCGG TTCACCGGGG CCAGGCACTA CTCGTTCACC 
GACGCCGAGG CGCTCGCGCC CCAGCTCACC GGGCTGCCGG AGAGCACGGT GCGCGAGCTC 
ATCGGGACGA TCGGCCCCGG CCAGGCGATC GCGGCACAGC GGGCCTACGT CGCGGCCTTC 
TTCGACCTGC ACCTGAAGGG GCGTGACACG CCGCTGTTCG ACGGTCCCAG CGGGCGGTAC 
CCGGCGGTCG AGCTCATCCC GTAG

Protein sequence

MPISARTVPT GKVIAGLAVA AALVAPAGTP ALARSSDEAA TLTLPAPTGR YPVGTVSLHL 
VDRSRPDPWV ASPPYRELMV SVWYPARRSP NLPVAPHMSP RAAEDFGGTL AAALFGTEPG 
EVDWAATETH ARAGAPVSRR AGRLPVVLFS PGFGAPRSVG TTVIEDLAGR GYVVVSVDHT 
YEAAQVEFPG GRLERSTFPP QPTQDAMNKA LEVRVADTRF VLDQLAGLDR GHNPDAGRRP 
LPEGLRGGLD LSRVGMFGHS MGGATAAQVV HDDRRVDAGV NLDGGHRGAV ARTGLAKPFL 
QVAAEPHTRA GDPTWRSFWD GSKGWKRELR FTGARHYSFT DAEALAPQLT GLPESTVREL 
IGTIGPGQAI AAQRAYVAAF FDLHLKGRDT PLFDGPSGRY PAVELIP