Gene Sros_1230 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1230
Symbol
ID	8664505
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	1260500
End bp	1261969
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	70%
IMG OID
Product	glutamate--cysteine ligase, GCS2
Protein accession	YP_003336971
Protein GI	271962775
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.00550271
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGGTCGCG ATGTGCCTGC GATGGTGTTC AGCCGGGAGG ACCGACGGCG ATACCGGGAC 
AAGGTCCGCC GATGTCTTGA CGTCTTCGCG CAGATGTTGC GCGAGGCGAG GTTCGAGTGC 
GAACGGCCGA AGGCCGGGCT GGAGATCGAG CTCAACCTCG TGGACGACCG CGGCGACCCC 
GCGATGAAGA ACGCCGAGGT GCTGGCGGCG ATCGCCGAGC CGGACTGGGC CACCGAGCTC 
GGCCAGTTCA ACGTGGAGAT CAACGTCCTG CCGGAGTCCC TTGAGGGGGA CGGCCCCGTA 
CGGCTGGAGA AGGTCGTGCG GGACCGGCTC AACCACGCGG AGAACCGGGC CCACACGGTC 
GGCGGGCACC TGGTGATGGT GGGCATCCTG CCCACCCTGC GGGAGAGCGA CGTGCACGAG 
GGCACGCTGT CGGCCAACCC GCGCTACAAG CTGCTCAACG AGCAGATCTT CGAGGCCAGG 
GGCGAGGACC TGCACCTGGC GATCGACGGC GAGGAGACCC TCGACACCTA CGCCGACAGC 
ATCACCCCCG AGGCGGCCTG CACGAGCCTC CAGCTCCACC TCCAGGTCAG CCCCGCGGCT 
TTCGCCGCCC ACTGGAACGC GGCCCAGGCC ATCGCGGGCG CCCAGGTGGC GGTGGCGGCC 
AACTCCCCGT TCCTGTTCGG CCGCCAGCTC TGGCAGGAGA CCAGGATCCC GCTGTTCGAG 
CAGGCCACCG ACACCCGGCC GGTGGAGCTG AAGACCCAGG GCGTGCGGCC CAGGGTGTGG 
TTCGGCGAGC GGTGGATCAC CTCGGTCTTC GACCTGTTCG AGGAGAACGC GCGCTACTTC 
CCCGCGCTCC TGCCCATATG CGAGGACGCC GACCCGCGTG AGGAGCTGAC CCGCGGCGTC 
ACCCCCGCGC TGGACGAGCT GACCCTGCAC AACGGCACCG TCTACCGGTG GAACCGGCCG 
GTCTACGCCG TCGTCGACGA CATCCCGCAC CTGCGGGTGG AGAACCGGGT GCTGCCCGCC 
GGGCCGTCGG TCGCCGACGT CGCCGCCAAC GCCGCGTTCT ACTACGGCCT CATGCGCGTG 
CTTCCCCACG CCGAACGGCC GGTGTGGACC CGCATGTCCT TCGCCGCGGC CGGGGACAAC 
CTGCACTCCG CCGCCCGGCA CGGGCTGGAT GCGCGCCTCT ACTGGCCGGG ACTCGGCGAG 
GTGGCCGCCG CCGAACTGAT CCTGCGACGG CTGCTGCCGC TCGCCTACGA GGGCCTCGAC 
CTGTGGGGGG TGAACCCCGA GCCCAGGGAC CGGCTGCTGG GGATCATCGA GCAGCGGTGC 
GTGACAGGCA GGACCGGGGC GACCTGGCAG ATCGACACCG TGAAGGAGCT GGGGAACCTC 
GACCGGCGCG AGGCGCTGCG CCGGATGACC CTGCGCTACA TCGAGCACAT GCACACCAAC 
GAGCCCGTGC ACACCTGGCC GTCACCTTGA

Protein sequence

MGRDVPAMVF SREDRRRYRD KVRRCLDVFA QMLREARFEC ERPKAGLEIE LNLVDDRGDP 
AMKNAEVLAA IAEPDWATEL GQFNVEINVL PESLEGDGPV RLEKVVRDRL NHAENRAHTV 
GGHLVMVGIL PTLRESDVHE GTLSANPRYK LLNEQIFEAR GEDLHLAIDG EETLDTYADS 
ITPEAACTSL QLHLQVSPAA FAAHWNAAQA IAGAQVAVAA NSPFLFGRQL WQETRIPLFE 
QATDTRPVEL KTQGVRPRVW FGERWITSVF DLFEENARYF PALLPICEDA DPREELTRGV 
TPALDELTLH NGTVYRWNRP VYAVVDDIPH LRVENRVLPA GPSVADVAAN AAFYYGLMRV 
LPHAERPVWT RMSFAAAGDN LHSAARHGLD ARLYWPGLGE VAAAELILRR LLPLAYEGLD 
LWGVNPEPRD RLLGIIEQRC VTGRTGATWQ IDTVKELGNL DRREALRRMT LRYIEHMHTN 
EPVHTWPSP