Gene Sros_6970 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_6970
Symbol
ID	8670280
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	7682936
End bp	7684024
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	68%
IMG OID
Product	4-hydroxyphenylpyruvate dioxygenase
Protein accession	YP_003342414
Protein GI	271968218
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.91426
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCTCGT CAGGAACGCA GATCTTCGAA GACATGTTGC TCGATCACGT TGAGTTCTAC 
GTCAACGAGC TCGCGGCGAA AACGGACTGG TTCGTCGACA GCTTCGGCTT CTCGGTGTAC 
GCGACCACGG ACGCGTCGGA GAAGGAGCCC GAGGTCCGCT CGGTGGGGCT CGGCGGCAAC 
CGGATCCGGC TCGTGCTGAC CGAGCCGCTG GTGGGCGACC ATCCGGGTGC CGCCTACGTG 
GAGAAGCACG GCGACGGAGT GGCCGACATC GCGCTGCGGG TCACGGACGC CGCCGCGGCG 
TTCGACGAGG CCGTGCGGCG CGGCGCCCGC CCGGTGTCCC CGCCGGCCGG GTACGACGGC 
GTCGTGACAG CCACGATCAT GGGCTTCGGC GACGTGGCGC ACACCTTCGT GCAGCGCGCG 
GGTGACACGG ACGAGCGCGC GCTTCCCGGG CTGCGGCCGG TGTACGGGTC GGCGTCCGGC 
ACGGGCGGCA ACCTGGACGA GGTGGACCAC TTCGCGGTCT GCGTGGAGTC CGGCCAGATC 
GACGCGACAG TCGACTTCTA CCGGCACATT CTCGACTTCG AGCTGATCTT CACCGAGCAC 
ATCGTCGTCG GCTCCCAGGC GATGACCATC AAGGTGGTGC AGAGCAGGTC CGGCGCGGTG 
ACGCTGACCC TGATCGAGCC GGACGTGTCA CAGGTCGCCG GCCACATCGA CGAGTTCCTC 
AAGCACCACG GCGGTGCCGG CGTGCAGCAC ATGGCGTTCA CGGCCGGCGA CATCGTGGAG 
GCGGTGGGCA CCATCGGTGC CCGGGGCGTG GAGTTCCTGA GCACCCCGGA CGCCTACTAC 
AGCCTGCTCC CGGAGCGGAT GGAGCTGGGA CGGTACTCCG TCGACGAGCT GCGGAGGCTC 
AACATCCTGG TCGACGAGGA CCACGACGGC CAGCTCTACC AGATCTTCGC CCGATCCGTG 
CACCCGCGTA ACACGTTCTT CCTGGAGCTC ATCGAGCGGC TGGGGGCGCG TTCCTTCGGC 
AGCGGCAACA TCTCGGCGCT CTACCAGGCG GTGGAGCTCC AGCAGAGCAG GGAAGAGGCC 
GCCGCCTGA

Protein sequence

MASSGTQIFE DMLLDHVEFY VNELAAKTDW FVDSFGFSVY ATTDASEKEP EVRSVGLGGN 
RIRLVLTEPL VGDHPGAAYV EKHGDGVADI ALRVTDAAAA FDEAVRRGAR PVSPPAGYDG 
VVTATIMGFG DVAHTFVQRA GDTDERALPG LRPVYGSASG TGGNLDEVDH FAVCVESGQI 
DATVDFYRHI LDFELIFTEH IVVGSQAMTI KVVQSRSGAV TLTLIEPDVS QVAGHIDEFL 
KHHGGAGVQH MAFTAGDIVE AVGTIGARGV EFLSTPDAYY SLLPERMELG RYSVDELRRL 
NILVDEDHDG QLYQIFARSV HPRNTFFLEL IERLGARSFG SGNISALYQA VELQQSREEA 
AA