Gene Sros_4669 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_4669
Symbol
ID	8667963
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	5192010
End bp	5193557
Gene Length	1548 bp
Protein Length	515 aa
Translation table	11
GC content	68%
IMG OID
Product	hypothetical protein
Protein accession	YP_003340266
Protein GI	271966070
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.679977
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.120633
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACTCTC AGCAGGTCAC CGCCGAGCCG CCGTCGAACG ACAGGGGCGA GCGTGACTCC 
ACGGCGGGCG ACGTCCCCGG AGTTCTCCGG TCGCCGGCCT CAGGCGCCGA TCGCGCGCCC 
CTCATCTTCG ATGTGATCAT TGCCGGGTGC GGGCCGACCG GTGCGACGCT GGCCGCCGAA 
CTGCGGCTGC ACGATGTGCG GGTACTCGTT CTGGAGAAGG AAACCGAGCC CGCGTCGTTC 
GTCCGCATAG TCGGTCTGCA TATTCGCAGT CTCGAGCTGA TGGCCATGCG CGGACTGCTG 
GATCGCATTC TCCAGCATGG AAGACAGCGT CCGGCCGGCG GCTTCTTCGC CGCCATCCCC 
AAACCCGCGC CCAAGGGCCT GGATTCCGCA TACGCCTATC TGCTGGGCAT CCCGCAGCCG 
GTCATCGTTC ACCTGCTCGA AGAACATGCG ATCGAACTGG GTGCGCAGGT CCGGCGCGGT 
TGCGCGGTCG CCGGTTTCGA GCAGGACGAC GAGGGGGTGA CCGTCGAGCT GGCCGACGGG 
GAACAGCTGC GTTCGCGCTA CCTCGTCGGC TGCGACGGCG GGCGCAGTAC GGTGCGCAAA 
CTGCTCGGCG TCGGCTTCCC CGGCGAGCCC TCGCGGACCG AGACGCTGAT GGGCGAGATG 
GAAGTGGGTG TGCCGCAGGA GGAGATCGCC GCCAAGGTGA CCGAAATCAG CGAGACCCAT 
CAGCCATTCT GGCTCAGGCC CTTCGGCGAA GGGGTCTACA GCGTCGTCGT CCCCGCCGCG 
GGAGTCAGCG ACCGCGCGGA ACCGCCCACC CTCGAGGATT TCAAACAACA GTTGCGCACC 
ATCGCCGGAA CCGATTTCGG CGTGCACTCC CCGCGCTGGT TGTCCCGCTT CGGGGATGCC 
ACCCGGCTGG CCGAACGTTA TCGGGTCGGG CGGGTGCTGC TGGCCGGCGA TGCGGCGCAC 
GTCCATCCAC CCATCGGCGG ACAGGGCCTC AACCTGGGCG TTCAGGACGC GTTCAACCTC 
GGCTGGAAAC TGGCCGCACA GATCCGCGGC TGGGCGCCGG AAACACTGCT GGACACCTAC 
CGGGCCGAAC GGCATCCGGT CGCCGAGGAC GTGCTGGACA ACACCCGCGC CCAGACGGAA 
CTGCTGTCCA CCGAGCCGGG TCCGCAGGCC GTGCGCAGGC TGCTCACCGA ACTGATGGAC 
TTCGACGAGG TGAACCGCCA TCTGATCGAG AAGATCACCG CGATCGGCAT CCGCTACGAC 
TTCGGCGCAG GCCCCGACCT GCTCGGCCGC CGCCTGCGCG ACATCGACGT GAAACAGGGC 
CACCTCTATG GTCTGCTGCA TCGCGGCCGC GGCCTGCTGC TGGACCGCAC CGAACGCCTG 
ACCGTCGACG GCTGGTCAGA CCGGGTCGAT TACCTCGCGG ATCCCACGGC GGCACTGGAT 
GTTCCGTGCG TCCTGCTCCG TCCCGACGGC CACGTCGCCT GGATCGGCGA CGATCAGCAG 
GATCTGGACG ACCACCTCTC CCGCTGGTTC GGCAAGCCCG CCGACTGA

Protein sequence

MHSQQVTAEP PSNDRGERDS TAGDVPGVLR SPASGADRAP LIFDVIIAGC GPTGATLAAE 
LRLHDVRVLV LEKETEPASF VRIVGLHIRS LELMAMRGLL DRILQHGRQR PAGGFFAAIP 
KPAPKGLDSA YAYLLGIPQP VIVHLLEEHA IELGAQVRRG CAVAGFEQDD EGVTVELADG 
EQLRSRYLVG CDGGRSTVRK LLGVGFPGEP SRTETLMGEM EVGVPQEEIA AKVTEISETH 
QPFWLRPFGE GVYSVVVPAA GVSDRAEPPT LEDFKQQLRT IAGTDFGVHS PRWLSRFGDA 
TRLAERYRVG RVLLAGDAAH VHPPIGGQGL NLGVQDAFNL GWKLAAQIRG WAPETLLDTY 
RAERHPVAED VLDNTRAQTE LLSTEPGPQA VRRLLTELMD FDEVNRHLIE KITAIGIRYD 
FGAGPDLLGR RLRDIDVKQG HLYGLLHRGR GLLLDRTERL TVDGWSDRVD YLADPTAALD 
VPCVLLRPDG HVAWIGDDQQ DLDDHLSRWF GKPAD