Gene Sros_8059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_8059
Symbol
ID	8671387
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	8873590
End bp	8875326
Gene Length	1737 bp
Protein Length	578 aa
Translation table	11
GC content	69%
IMG OID
Product	acetolactate synthase, large subunit
Protein accession	YP_003343457
Protein GI	271969261
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.634605
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAAC AGATGACAGG TGCCCAGGCC CTCGTCAGAG CGCTGGAGCA CGTCGGGGTC 
GACACTGTGT TCGGGATCCC GGGCGGCGCG ATTCTCCCCG CCTACGATCC TCTCTACGAC 
TCGGCCAAGG TCCGGCACGT GCTTGTACGG CACGAGCAGG GCGCAGGCCA CGCGGCCCAG 
GGCTACGCGC AGGCCACTGG CAGGGTCGGG GTCTGCATGG CCACCAGCGG CCCGGGCGCG 
ACCAACCTGG TCACCCCCAT CGCCGACGCC TACATGGACT CGGTCCCGAT CGTCGCGATC 
ACCGGCCAGG TGGCCAGCGC CGCCATCGGC ACCGACGCGT TCCAGGAAGC CGACATCTCC 
GGCATCACCA TGCCGATCAC CAAGCACAAC TTCCTGGTCA TCAACCCGGA TGACATCCCC 
AGGACGATCG CCGAGGCCTT CCACATCGCC GCGACGGGGC GTCCGGGGCC GGTGCTGGTC 
GACATCGCCA AGGACGCGCT CCAGGCGATG ACGACCTTCC AGTGGCCGCC GGTGATGCAG 
CTGCCGGGCT ACCGCCCGGT GACGCGGCCG CACTCCAAGC AGATCCGGGA GGCGGCCAAG 
CTGATCGCCG ACGCCAAGCG GCCGGTGCTC TACGTCGGCG GTGGCGTGCA CAAGGCGCGG 
GCGGCGGCGG AGCTGCTGGA GTTCGCCGAG CTGACCGGCA TCCCCGTGGT CACGACGCTG 
ATGGCGCGCG GCACCTTCCC CGACAGCCAC CGCCAGCACC TGGGCATGCC GGGCATGCAC 
GGCTCGGTGC CGGCGGTCGG GGCGCTGCAG CGCTCCGACC TGATCATCGG GCTCGGGGTC 
CGCTTCGACG ACCGCGTCAC CGGGCAGCTG TCCACCTTCG CCCCGCACGC CAAGATCGTC 
CACGCCGACA TCGACCCGGC GGAGATCTCC AAGAACCGGC ACGCGGACGT CCCGATCGTG 
GGCGACTGCA AGGAGGTCAT CTCCGACCTG ATCGCCGCGG TGCGCAACGA GGACCGCAAG 
GGCGACTACA GCGAGTGGTG GACCCAGCTC GACGCCTACC GGGCGACCTA CCCGCGGGGC 
TACGACGAGT TCGAGGACGG CTCCCTCGCC CCGCAGTACG TCATGGAGCG GCTGAGCGCG 
CTCGTCGGGC CGGACGCCAT CTACACCGCG GGCGTCGGCC AGCACCAGAT GTGGGCCGCC 
CAGTTCATCG GCTACGAGAA CCCCGGGACC TTCATCAACT CCGGCGGCGC CGGCACGATG 
GGCTTCGCGC TGCCGGCCGC GATGGGCGCC AAGATGGGCA GCCCGGACAC CACGGTCTGG 
GCCATCGACG GCGACGGCTG CTTCCAGATG ACCAACCAGG AGCTGGCCAC CTGCACCATC 
GAGGGTGTGC CGATCAAGGT CGCGATCATC AACAACGGCA ATCTCGGCAT GGTCCGGCAG 
TGGCAGACGC TGTTCTACAA CCAGCGCTAC TCCAACACCG ACCTGCAGAC GGTCCGCCGG 
ATCCCGGACT TCGTGAAGCT GGCCGAGGCG TACGGTTGTG TCGGCCTGCG GTGCGAGCGC 
CCCGAAGACG TGGACGCGAC CATCAAGAAG GCGATGGAGA TCAACGACGT GCCTGTCGTG 
GTCGACTTCG TGGTCCACCA GGACGCCATG GTCTGGCCGA TGGTCGCGGC CGGGACCAGC 
AACGACGAGA TCAAGTTCGC GCGCGACATG GCGCCGGTCT GGGACAGCGA GGACTAG

Protein sequence

MTEQMTGAQA LVRALEHVGV DTVFGIPGGA ILPAYDPLYD SAKVRHVLVR HEQGAGHAAQ 
GYAQATGRVG VCMATSGPGA TNLVTPIADA YMDSVPIVAI TGQVASAAIG TDAFQEADIS 
GITMPITKHN FLVINPDDIP RTIAEAFHIA ATGRPGPVLV DIAKDALQAM TTFQWPPVMQ 
LPGYRPVTRP HSKQIREAAK LIADAKRPVL YVGGGVHKAR AAAELLEFAE LTGIPVVTTL 
MARGTFPDSH RQHLGMPGMH GSVPAVGALQ RSDLIIGLGV RFDDRVTGQL STFAPHAKIV 
HADIDPAEIS KNRHADVPIV GDCKEVISDL IAAVRNEDRK GDYSEWWTQL DAYRATYPRG 
YDEFEDGSLA PQYVMERLSA LVGPDAIYTA GVGQHQMWAA QFIGYENPGT FINSGGAGTM 
GFALPAAMGA KMGSPDTTVW AIDGDGCFQM TNQELATCTI EGVPIKVAII NNGNLGMVRQ 
WQTLFYNQRY SNTDLQTVRR IPDFVKLAEA YGCVGLRCER PEDVDATIKK AMEINDVPVV 
VDFVVHQDAM VWPMVAAGTS NDEIKFARDM APVWDSED