Gene Sros_3039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3039
Symbol
ID	8666326
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	3313781
End bp	3315337
Gene Length	1557 bp
Protein Length	518 aa
Translation table	11
GC content	72%
IMG OID
Product	4-phytase
Protein accession	YP_003338734
Protein GI	271964538
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGCTGG CCCGGCGCCT GGCCGCCCTG TCCGTGACGT TCGGCCTGCT CGCGGCCGCC 
TGCGCCAACC CCGGCAGCGG TCCCGCCGCC CCCGGGGACG CCTTCGTCGT CGGCCTCGGC 
TCCGAGTTCG ACAGCCTCAG CCCGGTGATG GGCTACGCGC CCGACGGCGG ATCGCTGATG 
TACGAGGGGC TGATGAGCCG CGGGCCCGAT CTGTCGATGA GACCGGCGCT CGCCTCCGCC 
GCGCCGGTCA CCTCCGCCGA CGGCAGGACG GTCACCTTCG CCCTCCGCGA CGGCGTGCGG 
TTCCACGACG GCAGGCCGGT CACCGCCGCC GACGTGGAGT ACACCTACGA GGCGCTGCTG 
GAGGAGGCCA ACAACTCCCC GATCCGGGGC GACTACGCCG CGATCAAGGA GGTGGCCGCG 
CCGGACGCCA GGACCGTGGT GTTCACCCTC CACCATCCCT ACGCGCCGCT GGTCCAGCGC 
GCCACGCTCG GCATCGTCCC CAAGGACGCC CCGCTGACGG GCGACAGGCC GATCGGCGCC 
GGGCCGTACA GGTTCGTCTC CCGGACGCCC GGCGACAAGA TCGTGCTGGA GGGCAACCGG 
GACTACTGGG GCGGCGCCCC GGCCATCACC CGGCTGGTGC TGGCCTTCGC CGAGGACGAC 
AACGTCCGGG CGACGCGGAT GTCGGCCGGG GAGTTCGACG CCACGATCCT GCCGCCCAAG 
GCCGCGGCGC AGTTCGGCGG CCGGCAGGAC GTCACGGTCC ACCAGGTGCC CAGCGCCGAC 
TACCGCGGCA TCATGTTCCC GCTGGACCAG CCGGTCACCG GGGACAGGAC GGTCCGCAAG 
GCGTTCAGCC TGGCCATCGA CCGCAAGGCG ATGGTGGACA CCATCCTCGC CGGAGCGGGC 
ATCCCCGCCT TCGGCCCCGT CTCCCCCGAC ACGGCCTGGC ACGCCCCGGA GGTGACCGGC 
GCCGCGTCCG GGGATCCCGA GGCCGCCGGG CGGCTGCTGG ATGAAGCCGG CTGGAAGCCC 
GGCGAGGACG GCGTACGGGT CAAGGACGGC AGGCGGGCCG CGTTCTCGCT GATGTATCCG 
GCGGGCGACT CGCTCCGCAA GGACCTCGCG CTGACGGTGG CCTCCGACGC CAGGAAGATC 
GGCGTGGACG TCCAGCTCGC CGGACTCGAC TGGGACGCGA TCGAGCCGCG CATGGCCAAG 
GACGCCCTGA TCATGGGCTG GGGCAGCCCG TACGACCCGG ACTACGTCAA CTACGAGCTG 
TTCCACTCCG CCTACGCGGG CAAGGGCTTC TTCAACCCCG GCCGGTACCG CGACCCGGAG 
GTGGACCGGC TCCTGCGGAC CGGCCGCGAG TCCGGTGACG ACGCCACCCG CAAGCGCGCC 
TACCGCGACT TCCAGAAGAT CGTGCACGAC GACGAGGTCT GGACCTACCT CGTCTTCCTC 
AAGCACGTCT ACGTGATCCG CGGCCGCTAC CAGGGGATAC AGCCCAGCGT GGACGCCCAC 
GAGCACGCCG TCGGCGGCCT GTTCCGCGAC ATCCACACCT GGAAGCCCGC GGCATGA

Protein sequence

MRLARRLAAL SVTFGLLAAA CANPGSGPAA PGDAFVVGLG SEFDSLSPVM GYAPDGGSLM 
YEGLMSRGPD LSMRPALASA APVTSADGRT VTFALRDGVR FHDGRPVTAA DVEYTYEALL 
EEANNSPIRG DYAAIKEVAA PDARTVVFTL HHPYAPLVQR ATLGIVPKDA PLTGDRPIGA 
GPYRFVSRTP GDKIVLEGNR DYWGGAPAIT RLVLAFAEDD NVRATRMSAG EFDATILPPK 
AAAQFGGRQD VTVHQVPSAD YRGIMFPLDQ PVTGDRTVRK AFSLAIDRKA MVDTILAGAG 
IPAFGPVSPD TAWHAPEVTG AASGDPEAAG RLLDEAGWKP GEDGVRVKDG RRAAFSLMYP 
AGDSLRKDLA LTVASDARKI GVDVQLAGLD WDAIEPRMAK DALIMGWGSP YDPDYVNYEL 
FHSAYAGKGF FNPGRYRDPE VDRLLRTGRE SGDDATRKRA YRDFQKIVHD DEVWTYLVFL 
KHVYVIRGRY QGIQPSVDAH EHAVGGLFRD IHTWKPAA