Gene Sros_3288 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3288
Symbol
ID	8666576
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	3582476
End bp	3583807
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	70%
IMG OID
Product	3-deoxy-7-phosphoheptulonate synthase
Protein accession	YP_003338970
Protein GI	271964774
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.195174
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCATCA ACCTCGATTC CTGGCGGCAG CTGCCTGCGG CGCAGCAGCC CGAGTGGCCC 
GACCGCGGCG AGCTGGACAA GGTCGTCGCC GAACTGCAGG GGCTGCCGCC CCTGGTCTTC 
GCAGGGGAGT GTGACAACCT CAAGGCGGAT CTGGCGGCGG TGGCGCGGGG CGAGGCCTTC 
GTGCTGCAGG GCGGCGACTG CGCCGAGACG TTCGCCGGGG CCACCGCGGA CGACGTGCGC 
AACAAGCTGA AGACGCTGCT GCAGATGGCG ATCGTGCTCA CCTACGCGGC GAAGGTACCG 
GTCGTGAAGA TCGGCCGGAT GGCCGGGCAG TTCGCCAAGC CCCGTTCCAA GAACACCGAG 
ACCCGGGACG GCGTGGAGCT GCCCGCCTAC CGGGGCGACA TGGTCAACGG CTTCGACTTC 
ACCCCCGAGT CCCGCGTCCC CGACCCCTGG CGGCTGCTGC GCGCCTACCA CTCCTCCGCG 
GTGACGCTGA ACCTGGCCCG CGCCTTCACC AAGGGCGGCT ACGCCGATCT GCGCCAGGTG 
CACGCCTGGA ACCAGGACTT CGTGATCGAG TCCCCGGCCG GGAAGCGCTA CGAGCAGCTC 
GCCCGGGAGA TCGACCAGGC GCTGGCGTTC ATGCGCGCCT GCGGGGCCGA GCCGGAGGAG 
TTCCACAGCG TCGAGTTCTA CTCCTCGCAC GAGGCCCTGA TCCTCGACTA CGACCGCGCG 
CTCACCAGGA TCGACTCGCG GACCGGCCAG CCGTACGACG TGTCGGCGCA CATGGTCTGG 
ATCGGCGAGC GCACCCGCCA GCTCGACAGC GCGCACGTGG AGTTCTTCGC CCGGATCCGC 
AACCCGATCG GCGTGAAGCT CGGCCCGACG ACCACGCCGG AGGACGCCCT CGCGCTGATC 
GACAAGCTGA ACCCGGACAA CGAGGCCGGG CGGCTGACGT TCATCACCCG GATGGGCGCG 
CCGAAGATCC GCGAGCACCT TCCCGCGCTG GTGGAGAAGG TCACCGCGAG CGGCGCCCAG 
GTGGCGTGGA TCTGCGACCC CATGCACGGC AACACCTTCG AGGCGCCCAG CGGCCACAAG 
ACCCGCCGCC TGGACGACGT GCTGAACGAG GTGGCGGGCT TCTTCGACGT CCACCGCGAC 
CTCGGCACCC ACCCCGGCGG CATCCACATC GAGTTCACCG GTGACGACGT CACCGAGTGC 
GTGGGCGGCG GCGCGGAGAT CGTCGAGGAC GACCTGGCCC TGCGCTACGA GACGGCGTGC 
GACCCGCGCC TCAACCGGAG CCAGTCGCTG GACCTGGCCT TCCGGGTGGC GGAGCTCTAC 
CGCTCGGTCT GA

Protein sequence

MSINLDSWRQ LPAAQQPEWP DRGELDKVVA ELQGLPPLVF AGECDNLKAD LAAVARGEAF 
VLQGGDCAET FAGATADDVR NKLKTLLQMA IVLTYAAKVP VVKIGRMAGQ FAKPRSKNTE 
TRDGVELPAY RGDMVNGFDF TPESRVPDPW RLLRAYHSSA VTLNLARAFT KGGYADLRQV 
HAWNQDFVIE SPAGKRYEQL AREIDQALAF MRACGAEPEE FHSVEFYSSH EALILDYDRA 
LTRIDSRTGQ PYDVSAHMVW IGERTRQLDS AHVEFFARIR NPIGVKLGPT TTPEDALALI 
DKLNPDNEAG RLTFITRMGA PKIREHLPAL VEKVTASGAQ VAWICDPMHG NTFEAPSGHK 
TRRLDDVLNE VAGFFDVHRD LGTHPGGIHI EFTGDDVTEC VGGGAEIVED DLALRYETAC 
DPRLNRSQSL DLAFRVAELY RSV