Gene Sros_7610 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_7610
Symbol
ID	8670931
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	8403331
End bp	8404509
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	72%
IMG OID
Product	4-hydroxybenzoate 3-monooxygenase
Protein accession	YP_003343027
Protein GI	271968831
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAACTC AGGTCGGGAT CGTCGGGGCG GGCCCCGCCG GGCTGCTGCT GTCCCATCTG 
CTCCATCTGC GGGGCATCGA CTCGGTCGTG CTGGAGGCGC GCAGCCGGGA GTACGTCGAA 
CAGCGCGTCC GGGCCGGCGT GCTGGAGCAG GGCACGGTCG ACGTGCTCAA CGAGGCGGGC 
GTCGGCGAGC GGATGCGCGC CGAGGGGCTG CCGCACCACG GCATCGAGCT GCGGTACGGC 
GGGGCCGGGC ACCGCATCCC GTTCGAGAGG CTCGTCCCCG GCCGGGCCAT CACCGTGTAC 
GGCCAGCAGG AGGTCGTCAA GGACCTGATC GCCCGGCGGC TGGCCGACGG CGGGAAGATC 
CTCTTCGACG TCCCGGACGT CGCCCCGCAC TCACTCCAGG CCGACCCCTA CCTCACCTTC 
GGGGGCGAGC GCCTCGACTG CGACGTCATC GCGGGCTGCG ACGGCTTCCA CGGCGTCTGC 
CGGCCGTCCA TCCCCGACGG GGTTCTGTCG ATCTTCCAGC GGGACTATCC GTTCGCCTGG 
CTCGGCATCC TCGCCCAGGT CCCGCCGTCG GCCGAGGAGC TGATCTACTC GCGCAGCGAC 
CGGGGCTTCG CGCTGCACAG CATGCGCTCC CCGGAGATCA GCCGCTTCTA CCTCCAGGTC 
CCGCCGGACG CCTCGCTGGA CGACTGGCCG GACGAGCGGA TCTGGGCCGA GCTGCGGGCG 
CGGCTGGAGA CGGTCCCCGG GTTCGCGCTG ACCGAGGGGC CGATCATCTC CAGGGACCTG 
TCCGCGATGC GCTCGTTCGT CGCCGAGCCG ATGCGCTACG GCAGGCTCTA CCTCGCCGGG 
GACGCCGCCC ACATCGTGCC GCCGACCGGG GCCAAGGGCC TCAACCTGGC CGTCGCCGAC 
GTGCGGGTGC TGACCGAGGC CCTGGCGCAC CTCTACGCGA CGGGCTCCAC CGACCTGCTG 
GACGCCTACT CCGCCACCTG CCTGAAAAGG GTCTGGCGGG CCCAGCACTT CTCCTGGTGG 
ATGACCACGC TGCTGCACAC CTTCGACACC GACGACGCCT ACGGCAGGCG CCTGCAGACC 
TCCCACCTCG ACTACGTCAC CTCCTCGGAG GCCGCCGCGA CCACGCTCGC GGAGAACTAC 
GTCGGCCTGC CCCTCGACTC CGGAGCACCC CGTGACTGA

Protein sequence

MRTQVGIVGA GPAGLLLSHL LHLRGIDSVV LEARSREYVE QRVRAGVLEQ GTVDVLNEAG 
VGERMRAEGL PHHGIELRYG GAGHRIPFER LVPGRAITVY GQQEVVKDLI ARRLADGGKI 
LFDVPDVAPH SLQADPYLTF GGERLDCDVI AGCDGFHGVC RPSIPDGVLS IFQRDYPFAW 
LGILAQVPPS AEELIYSRSD RGFALHSMRS PEISRFYLQV PPDASLDDWP DERIWAELRA 
RLETVPGFAL TEGPIISRDL SAMRSFVAEP MRYGRLYLAG DAAHIVPPTG AKGLNLAVAD 
VRVLTEALAH LYATGSTDLL DAYSATCLKR VWRAQHFSWW MTTLLHTFDT DDAYGRRLQT 
SHLDYVTSSE AAATTLAENY VGLPLDSGAP RD