Gene Sros_1183 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1183
Symbol
ID	8664458
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	1209313
End bp	1210884
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	71%
IMG OID
Product	GMP synthase C terminal domain protein
Protein accession	YP_003336924
Protein GI	271962728
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.804519
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.853141
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTTCCTT TGGGGGTCTT GGTGTCTGAG TTCGACACGG TCCTGGTCGT CGACTTCGGT 
GCGCAGTACG CGCAGCTGAT CGCGCGACGG GTGCGTGAAT GCCACGTCTA CTCCGAGATC 
GTCCCGTCGA CGATGCCGGT GGAGGAGATG CTGGCCAAGA AGCCCAAGGC CATCATCCTG 
TCCGGCGGTC CCTCGTCGGT CTACGCCGAA GGCGCCCCGG CCGCGCCCGC CGGCCTGTTC 
GAGACCGGGG TCCCGACCTT CGGGATCTGC TACGGCTTCC AGATCATGGC CCAGGCCCTC 
GGTGGTCAGG TGGCCAGGAC CGGCATCGCT GAGTACGGCG GGACCCAGCT CGAAGTGACC 
CAGGAGGGCG TCCTGTTCTC GGGGCTGCCC GTCAAGCAGT CGGTCTGGAT GTCCCACGGC 
GACAGCGTCG CCGCCGCCCC CGAGGGCTTC CTCGTCACCG CCGCGACCTC CGAGACGCCG 
GTCGCCGCCT TCGAGCACCC CGGCAAGGGC CTGTACGGCG TGCAGTTCCA CCCCGAGGTC 
CTCCACTCCG AGCACGGCCA GACCGTGCTG AAGCACTTCC TCGACGCGGC GGGCTGCCGT 
CCCTCCTGGA CGATGCTCAA CATCGTCGAG GACGCCGTCG AGGCGGTCCG CGCCCAGATC 
GGCCCGGAGG GCCGCGCCAT CTGCGCGCTC TCCGGCGGAG TGGACTCCGC GGTCGCCGCC 
GCCATGGTGC AGCGTGCCAT CGGTGACCGT CTGACCTGCG TGTTCGTCGA CCATGGGCTG 
CTGCGCAAGG GGGAGGCCGA GCAGGTCGAG CGTGACTTCG TGGCCGTCAC CGGCGTCAAG 
CTCCGGGTGG TGGACGCCCA GGAGCGCTTC CTCAAGGCGC TCGACGGGGT CACCGACCCG 
GAGGAGAAGC GTAAGATCAT CGGCCGCGAG TTCATCCGGG TCTTCGAGGA CGAGCAGCGC 
GCCATCATCG CCGACGGTCC GGTCGACTTC CTCGTCCAGG GCACGCTCTA CCCCGACGTG 
GTCGAGTCCG GCGGCGGCAC CGGCACCGCC AACATCAAGT CGCACCACAA CGTCGGCGGC 
CTCCCCGACG ACCTGCAGTT CTCGCTGGTG GAGCCGCTGC GCGCGCTGTT CAAGGACGAG 
GTCCGCCGCG CGGGCGAGGA GCTCGGCCTG CCGGCCGCGA TGGTCTGGCG CCAGCCGTTC 
CCCGGTCCCG GCCTGGGCAT CCGCATCGTC GGCGCGGTCA CCCGCGACCG CCTGGAGATC 
CTCCGCGAGG CCGACGCCAT CGCCCGTGAG GAGCTCTCCC GCGCCGGCCT CGACCGGGAC 
ATCTGGCAGT GCCCGGTCGT CCTGCTCGCC GACGTCCGCT CGGTGGGCGT CCAGGGCGAC 
GGCCGCACCT ACGGCCACCC GATCGTCCTG CGCCCGGTCT CCAGCGAGGA CGCCATGACC 
GCCGACTGGT CCCGCGTCCC CTACGACGTG CTCGCCCGCA TCTCCACCCG GATCACCAAC 
GAGGTCCGCG AGGTCAACCG CGTGGTGCTC GACGTGACCA GCAAGCCCCC GGGCACCATC 
GAGTGGGAGT AG

Protein sequence

MFPLGVLVSE FDTVLVVDFG AQYAQLIARR VRECHVYSEI VPSTMPVEEM LAKKPKAIIL 
SGGPSSVYAE GAPAAPAGLF ETGVPTFGIC YGFQIMAQAL GGQVARTGIA EYGGTQLEVT 
QEGVLFSGLP VKQSVWMSHG DSVAAAPEGF LVTAATSETP VAAFEHPGKG LYGVQFHPEV 
LHSEHGQTVL KHFLDAAGCR PSWTMLNIVE DAVEAVRAQI GPEGRAICAL SGGVDSAVAA 
AMVQRAIGDR LTCVFVDHGL LRKGEAEQVE RDFVAVTGVK LRVVDAQERF LKALDGVTDP 
EEKRKIIGRE FIRVFEDEQR AIIADGPVDF LVQGTLYPDV VESGGGTGTA NIKSHHNVGG 
LPDDLQFSLV EPLRALFKDE VRRAGEELGL PAAMVWRQPF PGPGLGIRIV GAVTRDRLEI 
LREADAIARE ELSRAGLDRD IWQCPVVLLA DVRSVGVQGD GRTYGHPIVL RPVSSEDAMT 
ADWSRVPYDV LARISTRITN EVREVNRVVL DVTSKPPGTI EWE