Gene Sros_3982 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3982
Symbol
ID	8667276
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	4437547
End bp	4439694
Gene Length	2148 bp
Protein Length	715 aa
Translation table	11
GC content	71%
IMG OID
Product	anthranilate synthase
Protein accession	YP_003339635
Protein GI	271965439
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.758299
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAGACGA GCGGATATAC CACCGCCGGT GGCATCGAGG TCGAGGTCAC GGCGTCCGAT 
GTGCCCGAGA CGGTGCTTGA GGACGTCGTG ACGACGCTCG GCGAGCGTCG CGGAGGCGTG 
CTCTCCTCCG GGATGGAGTA TCCCGGCCGC TACAGCCGAT GGCACCTGGC CTACGTCGAC 
CCCTGCCTGG AGATCGTGGC CAGGGGCCGC AGGATCTCCG CCCGCGCCCT GAACGCGCGG 
GGCAGGGTCG TGCTTCCGGC CGTCGCGTCC TGCCTGCTGG CCACCGGCAA GCCCACCGGG 
GAACCGACCG CCGAGCACGT CGAGGTCTAC GTCGCCGAGT CCGAGGACAT CCTCCCCGAG 
GAGATGCGCA GCCGCCGCCC CACGGTCTTC ACCGCGATCC GCGAGGTCAT CGCCGCGTTC 
AAGGGCGAGA ACGAGCACCT GGGGCTGTAC GGCTCCTTCG GATACGACCT GGCCTTCCAG 
TTCGAGCCGA TCCGGCAGGT CCTCACCCGG GCCGACGACC AGCGCGACCT CGTGCTGCAC 
CTGCCCGACC GGGTGATGGT GATCGACCGC AAGCGGGAGA CCAGCAAGGA ATACCTCTAC 
GAGTTCACCG TGGACGGGGT CTCCACCCGC GGCCTGGCCC GCGAGGGGGA GAGCATCCCG 
CTGCCCCCCG CCCCGGCCGA GCTGCCCGCC GACCCGGAGA AGGGCACCTA CGCGCAGGTC 
GTCGCCGCGG CCAAGGAGAA GTTCGTCCGC GGCGACCTGT TCGAGGTCGT CCCCGGCCAG 
GTCTTCCACG CCGCGTGCAC CGACCCCGCC GCCTTCTACC GGGGGCTGCG CAAGGCCAAC 
CCGGCGCCGT TCGAGTTCCT GTTCAACCTC GGCGAGGGCG AGCACCTGGT CGGCGCCTCC 
CCGGAGATGT ACGTCCGGGT CAGCGGCGAC CGTGTCGAGA CCTGCCCGAT CTCCGGCACC 
ATCGCCCGCG GCGGCAACCC GATCGAGGAC GCCGAGGCGA TCCGCACCCT CCTGTCCAGC 
GTGAAGGAGG AGTCGGAGCT GACCATGTGC ACCGACGTGG ACCGCAACGA CAAGTCCCGC 
ATCTGCGTGC CGGGCACCGT GCAGGTCATC GGGCGGCGGC AGATCGAGAT GTACTCCCGG 
CTGATCCACA CCGTCGACCA CATCGAGGGC CGCCTGCGGC CGGAGTTCGA CGCGCTGGAC 
GCCTTCCTCA CCCACATGTG GGCCGTCACC GTCACCGGCG CCCCGAAGTC CTGGGCGATG 
CAGTTCATCG AGGACCACGA GGCCACCACC AGGCGCTGGT ACGGCGGGGC GGTCGGCTAC 
ATCGGCTTCG ACGGCTCCAT GAACACCGGC CTGACCCTGC GCACCGCGCA GATCCGCGGC 
GGCGTCGCCA CCGTCAGGGC CGGTGCCACG CTGCTGTTCG ACTCCGACCC GGAGGCCGAG 
GAGCGTGAGA CCGAGCTCAA GGCCAGCGCG CTGCTCGGCG CCCTGGCCGC GGTCGGCGCG 
GCCCGGACCC CGCAGGAGCG GGACGTGCCG CAGCCGGTCC GGGAGCAGCC GGGGGAGGGG 
ATGAAGGTGC TGCTGGTGGA CCACGAGGAC TCCTTCGTCA ACACCCTGGC CGACTACTTC 
CGCCAGCAGG GCGCGGAGGT CGTCACCCTC CGGCACGGCT TCCCCGTGAG CATGATCGAC 
GAGATCGCGC CGTCCCTCGT GGTGCTGTCG CCCGGCCCCG GCTGGCCGTC GGACTTCGGC 
CTGCCGGAGC TGGTCGGGGC GCTCTACGAG CGCGACCTGC CGGTGTTCGG CGTCTGCCTG 
GGCCTGCAGG GCATGGTCGA GCAGGCGGGC GGCACGCTGG AGCTGCTGTC CCACCCTGAG 
CACGGCAAGC GCGGTCAGGT GCGGCGGACC GGTCCCGGCG CGCTGCTGGA GGGGCTCCCG 
GAGGAGTTCA CCGCGGCCCG CTATCACTCC CTCCACGCCA AGCAGCCCGG AGTCGTCGGC 
TTCACCGCCA CCGCCCTCAC CCCCGACGGC GCGGTGATGG CGATCGAGGA CGTGGCCAGG 
AGGCGCTTCG CCGTGCAGTT CCACCCCGAG TCGATCCTCA CGGCCGAGGG CGGGGCCGGG 
GCGAAGATCA TCTCCAACGT TCTCCGGCTC TGCCGTACCT CTGGGTAA

Protein sequence

METSGYTTAG GIEVEVTASD VPETVLEDVV TTLGERRGGV LSSGMEYPGR YSRWHLAYVD 
PCLEIVARGR RISARALNAR GRVVLPAVAS CLLATGKPTG EPTAEHVEVY VAESEDILPE 
EMRSRRPTVF TAIREVIAAF KGENEHLGLY GSFGYDLAFQ FEPIRQVLTR ADDQRDLVLH 
LPDRVMVIDR KRETSKEYLY EFTVDGVSTR GLAREGESIP LPPAPAELPA DPEKGTYAQV 
VAAAKEKFVR GDLFEVVPGQ VFHAACTDPA AFYRGLRKAN PAPFEFLFNL GEGEHLVGAS 
PEMYVRVSGD RVETCPISGT IARGGNPIED AEAIRTLLSS VKEESELTMC TDVDRNDKSR 
ICVPGTVQVI GRRQIEMYSR LIHTVDHIEG RLRPEFDALD AFLTHMWAVT VTGAPKSWAM 
QFIEDHEATT RRWYGGAVGY IGFDGSMNTG LTLRTAQIRG GVATVRAGAT LLFDSDPEAE 
ERETELKASA LLGALAAVGA ARTPQERDVP QPVREQPGEG MKVLLVDHED SFVNTLADYF 
RQQGAEVVTL RHGFPVSMID EIAPSLVVLS PGPGWPSDFG LPELVGALYE RDLPVFGVCL 
GLQGMVEQAG GTLELLSHPE HGKRGQVRRT GPGALLEGLP EEFTAARYHS LHAKQPGVVG 
FTATALTPDG AVMAIEDVAR RRFAVQFHPE SILTAEGGAG AKIISNVLRL CRTSG