Gene Sros_1046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1046
Symbol
ID	8664320
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	1062151
End bp	1063278
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	72%
IMG OID
Product	glycerophosphoryl diester phosphodiesterase
Protein accession	YP_003336789
Protein GI	271962593
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.413626
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.0540655
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCGGC ACCCGAGGGC CGCCCGGCCG ACGACGCCCG CCCAGCCACC GAACGCGGCT 
CAACCCCCGA GTACGGCTCG GCCCACGGGT CCGTCGTCCG CCCCGCTCGG CGGTGGCGCT 
CGTCTGCCGA TCGTCGTCGC GCATCGGGGG GCCAGCGCCT TCCGGCCCGA GCACACGCTT 
CTCGCCTACG AGGTCGCCAT CCGGCTGGGC GCCGACTACA TCGAGCCGGA CCTGGTCTCC 
ACCAAGGACC ACGTGCTGGT CTCCCGGCAC GAGAACGAGC TCTCGGCGAC CACCGACGTC 
GCCGGCCACC CGGAGTTCGC CGCCCGCAGG ACGACCAAGA CCATCAACGG CGGCCGGGTG 
ACCGGCTGGT TCACCGAGGA CTTCACCCTC GCCGAGCTGC GTACCCTCCG CGCCAGGGAA 
CGCTTCCCCC GGCGGCGGCC GGCCAGCACG GCATACGACG GGAAGGCGCA GATCCCGACG 
CTGGAGGAGA TCGTCCTGCT CGCGCAGAAG CACGGCGTGG GCATCTATCC CGAGATCAAA 
TATCCGAGCT ACTTCGCCTC GATCGGGCTG CCGATCGAGG GACCGCTGCT GGAGACCCTC 
CGGCGCCACG GCTGGGACGA CGCCTGCGAT CCGGTGTTCA TCCAGTCCTT CGAGACGGGG 
AACCTCAAGC GGCTGCGGTC CGTCACACGG TTGCGGCTCA TCCAGCTCAT CGGGGCCGGA 
AGCGGCCCGC CGTACGATCT GCTGAAGAGC GTCAACCCGC CCACCTGCGA CGATCTCGTC 
ACCCCGGCCG GTCTGCGGCA GATCGCCGCG TACGCCACCG GCATCGGTGT GACCACCACG 
CGGATCGTGC CGGTCGGCTC CGACGGGAGA CTGGGCGCTC CCACCTCGCT CGTCCAGGAC 
GCCCACCAGC TGGGTCTCCA GGTTCACGTC GCGACGATCC GCGACGAGAA CATGAGCCTC 
CCGGCGGACT ACCGGCGGGG CGATCCCGCC GGACGGGCCT ACTCCCGTGC CGCCGGGGAC 
GTGACGGGCT GGCTGGCACG GCTGTACGGG CTCCGGGTGG ACGGGGTGCT CGCCGACAAC 
CCGGGTGTCG CCCGTGCCGT ACGGGATCGC CTGCTCACCG GCGGCTGA

Protein sequence

MARHPRAARP TTPAQPPNAA QPPSTARPTG PSSAPLGGGA RLPIVVAHRG ASAFRPEHTL 
LAYEVAIRLG ADYIEPDLVS TKDHVLVSRH ENELSATTDV AGHPEFAARR TTKTINGGRV 
TGWFTEDFTL AELRTLRARE RFPRRRPAST AYDGKAQIPT LEEIVLLAQK HGVGIYPEIK 
YPSYFASIGL PIEGPLLETL RRHGWDDACD PVFIQSFETG NLKRLRSVTR LRLIQLIGAG 
SGPPYDLLKS VNPPTCDDLV TPAGLRQIAA YATGIGVTTT RIVPVGSDGR LGAPTSLVQD 
AHQLGLQVHV ATIRDENMSL PADYRRGDPA GRAYSRAAGD VTGWLARLYG LRVDGVLADN 
PGVARAVRDR LLTGG