Gene Sros_8838 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_8838
Symbol
ID	8672176
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	9757351
End bp	9759069
Gene Length	1719 bp
Protein Length	572 aa
Translation table	11
GC content	74%
IMG OID
Product	hypothetical protein
Protein accession	YP_003344214
Protein GI	271970018
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.139707
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTTACC ACGCTGTGGC ATGCGACTAC GACGGGACGC TGGCCGCAGA CGGTCACGTC 
GACGACGGCA CCGTGGCCGC CCTCGAACGC CTCGTGCGCT CCGGGCGGCG GCTGCTGCTG 
GTCACCGGCC GGCAGATCGA CGAGCTCAGA CGGGACTTCG GGCGGCTGGA CCTGTTCGAC 
CGGATCGTCG CCGAGAACGG GGCCGTGCTG TACCGCCCCA GGGAGCCCGC GGAGCAGGCG 
ACCTCGCCCC TGGCCGAGGG GCCGCCCGCC GCGCTCGTCG AGCGCCTGCG CGACCTGGGC 
GTGGAACCGC TCGGTGTCGG CTCGGTGATC GTGGCCACCT GGGAGCCCAA CGGCGAGACC 
GTTCTCCACG CGATCCGCGA CCTCGGCCTG GAGATGCAGG TGATCTTCAA CAAGGGCGCG 
ATCATGGTCC TGCCCTCGGG GATGAACAAG GCCAGCGGCC TGGCCGCCGC CCTGGCGGAA 
CTCGGGATAT CGGAGCACAG CACGGTGGGC GTGGGCGACG CCGAGAACGA CCACGCGTTC 
CTGGCGGCCT GCGAGTGCGC GGTGGCGGTG GCCAACGCGC TCCCCGCCGT CAAGGAACGC 
TGCGACCTGG TGACCGGGCG GGACCACGGC GCCGGGGTCA CCGAGCTGGT CGACCGCCTT 
CTCGCGGACG ACCTGGCCGG CGTGGACGTC GTGCGGCACC GCCTCCCGCT CGGCACCGGT 
GCGGCCGGCC AGGTGTCCGT CCCGCCGTAC GGCCTGCGGC TGCTGGTCGC CGGGCCCTCG 
CACAGCGGCA AGTCCACCGT CACCGCCGCG CTGCTGGAGC GTGTCGCCGG GGCCGGCTAC 
CAGTTCTGCC TGATCGATCC GGAGGGGGAC TACGCCGACG GGGTCGAGGG CGCGGTCGTG 
CTGGGCGACG CCCGGCGCGC GCCCACCGGC GAGGAGGTGC TCCGGCTGCT GGAGGACGTC 
CGGCAGAGCG TCGTGGTCAA CCTGCTGGGC CTGTCCATCG ACGACCGGCC GGGCTTCTTC 
GAGGCGTTGC TGCCCCGCCT GTCGGCGCTG TGCGCCCGCC AGGGGCACCC GCACTGGCTG 
GTGGTCGACG AGGCCCACCA CATGATGCCC GAGGGCTTCG GCCTGCAGCC GGCCGGGCTG 
CTGGGCGAGA TGGGCGGGCT GCTGCTGGTC ACCGTGCACC CCGGCGCGGT CAGCGAGCCG 
GTCGTGCGGG CGCTCAACGC GGTCGTCGCG GTGGGGGAGC GCCCGGGGGA CATCCTCGGC 
ACGTTCGCCG CCGCCACCGG CCAGGACATG TCCCACCGGG ACTTCCCCGA CCTGCCGACC 
GGGGAGCTGC TGTTCTGGGA GCTCGGCGGC GAGCCGGTCC GGGTGGAGCT GATCCCGCCC 
GAGGAGGAGC GCCGCCGGCA CCGCCGCAAG TACGCGACCG GCGAGCTCGG GGAGGACAAG 
AGCTTCTACT TCCGCGGCCC CCGGGAGGCG CTGAACCTGC GGGCCGACAA CCTCACGGCG 
TTCTGCCGCC TCGCCGAAGG CGTCGACGAC GACACGTGGA CCTATCACCT GGGCCGGGGC 
GACTACTCGC GATGGCTGGC GGAACAGGTC AAGGACGAGG AGCTGGCGGC CGAGGTGGCC 
GGGGTCGAAC GGGCTCCCGG AGAGTCTGCC GCCGAGACCA GAAGGCGCGT GTGCGAGCTC 
ATCGAGGCCC GGTACACCGC CCCCGCCGAA CCCACCTGA

Protein sequence

MRYHAVACDY DGTLAADGHV DDGTVAALER LVRSGRRLLL VTGRQIDELR RDFGRLDLFD 
RIVAENGAVL YRPREPAEQA TSPLAEGPPA ALVERLRDLG VEPLGVGSVI VATWEPNGET 
VLHAIRDLGL EMQVIFNKGA IMVLPSGMNK ASGLAAALAE LGISEHSTVG VGDAENDHAF 
LAACECAVAV ANALPAVKER CDLVTGRDHG AGVTELVDRL LADDLAGVDV VRHRLPLGTG 
AAGQVSVPPY GLRLLVAGPS HSGKSTVTAA LLERVAGAGY QFCLIDPEGD YADGVEGAVV 
LGDARRAPTG EEVLRLLEDV RQSVVVNLLG LSIDDRPGFF EALLPRLSAL CARQGHPHWL 
VVDEAHHMMP EGFGLQPAGL LGEMGGLLLV TVHPGAVSEP VVRALNAVVA VGERPGDILG 
TFAAATGQDM SHRDFPDLPT GELLFWELGG EPVRVELIPP EEERRRHRRK YATGELGEDK 
SFYFRGPREA LNLRADNLTA FCRLAEGVDD DTWTYHLGRG DYSRWLAEQV KDEELAAEVA 
GVERAPGESA AETRRRVCEL IEARYTAPAE PT