Gene Sros_3740 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3740
Symbol
ID	8667030
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	4152515
End bp	4153741
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	70%
IMG OID
Product	hypothetical protein
Protein accession	YP_003339406
Protein GI	271965210
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.180285
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0188939
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGATA ACAAGGGCGT CACCTACCAG GGGCCGGGCA AGGTGGAGGT GCAGACCATC 
GACTACCCCG AGTTCGAGCT CAAGGACGGC CCGGGGGTCA ACCCGGCCAA CGTGGGACGC 
AAGGTCCGGC ACGGTGCGAT CGTCAAGACC GTCGCGACGA ACATCTGCGG CAGCGACCAG 
CACATGGTCC GGGGCCGCAC CACCGCGCCG CCGGGGCTCA TCCTCGGCCA CGAGATCACC 
GGGGAGGTCG TCGAGACCGG CCCCGACGTG GAGTTCATCA AGAACGGCGA TCTCGTGTCC 
GTCCCCTTCA ACATCGCCTG CGGCCGCTGC CGCAACTGCA AGGAGGGCAA GACCGGGGTC 
TGCGAGAACG TCAACCCCGA CCGGCCCGGT TCGGCCTACG GCTACGTCGA CATGGGAGGC 
TGGCCCGGCG GGCAGGCCAA CTACGTGCTC GTCCCCTACG CCGACTGGAA CCTGCTGAAG 
TTCCCGGACA AGGACCGGGC GATGGAGAAG ATCCTCGACC TGGCGATGCT CTCGGACATC 
TTCCCGACCG GCTTCCACGG CTGCGTCACC GCCGGGGTGA AGCCGGGATC GACCGTCTAC 
ATCGCGGGCG CCGGCCCCGT AGGGCTCGCC GCCGGCGTCT CGGCGTTCCT GCTCGGCGCC 
GCCGTGGTCA TCATCGGCGA CCTGAACAAG GACCGTCTCG CCCAGGCCCG CAGCTTCGGC 
TGCGAGACCG TCGACGTGTC CCAGGGGGAG CCGAAGGACC AGATCGAGCA GATCCTCGGC 
GAGCCCGAGG TGGACTGCGG CGTCGACGCC GTCGGATTCG AGGCCCGCGG CCACGGCTCC 
GAGGCGGGCA CCGAACACCC CGCCACCGTG CTCAACTCGC TCATGGAGAT CACCCGCGCG 
GGCGGCGCGC TCGGCATCCC CGGGCTGTAC GTCACCGGCG ACCCGGGAGC CGCGGACGAG 
GCGGCCAAGC AGGGATCGCT GTCCATCCGG CTCGGCCTCG GCTGGGCCAA GTCGCTCGCC 
TTCACCACCG GCCAGTGCCC CGTCATGAGG TACAACCGCC AGCTGATGAT GGCGATCCTG 
AACGACCGGG TGCAGATCGC CAAGGCGGTC AACGCCACCC CGATCTCGCT CGACCAGGCA 
CCCCGGGGCT ACGAGGACTT CGACAAGGGC GCCGCGCGCA AGTACGTGCT GGACCCGAAC 
GGCATGCTGG GCACGGCCGC CTCGTAG

Protein sequence

MTDNKGVTYQ GPGKVEVQTI DYPEFELKDG PGVNPANVGR KVRHGAIVKT VATNICGSDQ 
HMVRGRTTAP PGLILGHEIT GEVVETGPDV EFIKNGDLVS VPFNIACGRC RNCKEGKTGV 
CENVNPDRPG SAYGYVDMGG WPGGQANYVL VPYADWNLLK FPDKDRAMEK ILDLAMLSDI 
FPTGFHGCVT AGVKPGSTVY IAGAGPVGLA AGVSAFLLGA AVVIIGDLNK DRLAQARSFG 
CETVDVSQGE PKDQIEQILG EPEVDCGVDA VGFEARGHGS EAGTEHPATV LNSLMEITRA 
GGALGIPGLY VTGDPGAADE AAKQGSLSIR LGLGWAKSLA FTTGQCPVMR YNRQLMMAIL 
NDRVQIAKAV NATPISLDQA PRGYEDFDKG AARKYVLDPN GMLGTAAS