Gene Sros_5254 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5254
Symbol
ID	8668548
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	5766591
End bp	5768384
Gene Length	1794 bp
Protein Length	597 aa
Translation table	11
GC content	74%
IMG OID
Product	Asparagine synthase (glutamine-hydrolyzing)
Protein accession	YP_003340766
Protein GI	271966570
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.381893
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.232411
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGAGA TCGCCGGTTG GGTGGACTTC GAACGCCAGC CCGCCACGGC AGGCGCCGTG 
GTCACCGAGA TGACCCGGGC CCTGGCCGCG GGGGAGGGCG GCGCCCCGCG GCTGTGGGCG 
GGGCCCGGGG GCGCCCTCGG CCTGGGCGGC GCCCGTTCGC ACGGCATGGC CGGCCGGGCA 
CCGCTCGACG CGCGTGGCGC GCGCGGCCCG GCGGTCATCG CGTTCGGGGG TGCCTGCGAC 
AACCGTGCGG AGCTGCGCGG CCTGCCAGGC CGCCCGGACG GCGAGGGCGA CGCGGCGGCG 
GTGCTGCACG CCTACCGGGT GCTCGGCGTC CGCTTCACCG AGCACCTGCG CGGCTCGTAC 
GCCTTCGCCC TCTGGGAGCC TCAGGACGCC GCGCTGACGC TGGTCCGGGA CCGGCTGGGC 
ACCCGACCGC TCTACTATCT GGAACTCGAC ACCGGCGTGG TCTTCGCCTC GCGGCCGGAG 
GCCGTCCTGG CACATCCGGC GGCACGCCCG GCGCTCGACG AGGACGGCCT GCGCATCGTG 
CTCTCCGGGA TCACCGTCCC AGGCCGGACC GTCTACCGGG ACGTCCGCGA GGTGCGTCCG 
GGCCACGCGG TCCGGTTCTC CTCCGGAGGC AGGACCGAAC GCCGCTACTG GGCGCTGTCG 
GCGGCCGAGC ACCGCGACGA CACCGCGACC ACCGTCGCAC GGGTCCGTGA GCTGCTGGCG 
GACGCCGTCG GCGAGCAGAC GGCCTCCGCC GGCCGGGCCG GCAGCCTGAT GTCGGGCGGG 
CTGGACTCCA GCACGCTCGC GGCGCTGCTC GCCGGGCGGC GGGAAGAGCG CCTGGCCACG 
TTCTCGGTCG ACTACCAGGG CTACGAGGAG AACTTCCGGC CGCACATCGT CCGGCCGGCA 
CCGGACAGCC CCTATGTCCG TGAGATGACA GCCCATCTCG GATCCGACCA TACCGACGTG 
GTGCTGACCA CCGGCGACCT CACCGCCCCC GACGTCTGGA ACGCCCTGGT GGCCGCGCTG 
GACCAGCCCC GGCTGTTCGC CGACATCGAA CCGTCGATGA TCCTGCTCTA CCGGGCGGTC 
CAGGGCAGGC TGGACACGGT GCTCAGCGGC GAGGGAGCGG ACGAACTCTT CGGGGGGTTC 
CCCTGGTTCC ACCACCCCCG GTGGGCCGAC GCGCCCGACT TCCCCTGGAC GCCGACGACC 
GACGAGCTGG TCGGCACCCT CTTCGCGCCG GCGATGAAGG ACCTGGCGGT GCCGGACTTC 
CGCGCCGAGC ACTACCGCGA GGCCCTGGCG GAGCTGCCCG CCCCGCCGGA TGAGGACCCC 
CGGGAGCGGC GGATGAGGGA GGTCGGCTAC CTTTTCGTCA CCCGCTTCCT GCCCGAGCAG 
CTCGACCGCG CCCACCGGCT GAGCGCCGGC TGCGGATTCG ACGTCAGGAT GCCCTTCTGC 
GACCACCGGC TGGTGGAGTA CGCGCTGAAC ATCCCGTGGG GCGTCAAGAA CTTCGACGGC 
TCGGAGAAGA GCGTGCTGCG CGCGGCCGCG GCCGGCCTGC TCCCGGCTTC CGTGCTGGAG 
CGCCGCAAGT CCGGGTACCC GATGACGCAC GACCGGGGAT ACGACCGGAT CCTGCGGGCG 
AAGGTCGGCG AGCTGGCTCC CGGCGGGCCG GTTCTGCCGC TGCTCGACGC GTCCGTGGTG 
GACCGCCTGC GCGAGGACCC GTCCCAGGGG CCGGCGCTCA GCCGTACCGA GCTGGAACTG 
GCCCTGAAGC TCGACGCCTG GCTCACCCGG TGGCGGCTCA CCCTGCCGGG CTGA

Protein sequence

MSEIAGWVDF ERQPATAGAV VTEMTRALAA GEGGAPRLWA GPGGALGLGG ARSHGMAGRA 
PLDARGARGP AVIAFGGACD NRAELRGLPG RPDGEGDAAA VLHAYRVLGV RFTEHLRGSY 
AFALWEPQDA ALTLVRDRLG TRPLYYLELD TGVVFASRPE AVLAHPAARP ALDEDGLRIV 
LSGITVPGRT VYRDVREVRP GHAVRFSSGG RTERRYWALS AAEHRDDTAT TVARVRELLA 
DAVGEQTASA GRAGSLMSGG LDSSTLAALL AGRREERLAT FSVDYQGYEE NFRPHIVRPA 
PDSPYVREMT AHLGSDHTDV VLTTGDLTAP DVWNALVAAL DQPRLFADIE PSMILLYRAV 
QGRLDTVLSG EGADELFGGF PWFHHPRWAD APDFPWTPTT DELVGTLFAP AMKDLAVPDF 
RAEHYREALA ELPAPPDEDP RERRMREVGY LFVTRFLPEQ LDRAHRLSAG CGFDVRMPFC 
DHRLVEYALN IPWGVKNFDG SEKSVLRAAA AGLLPASVLE RRKSGYPMTH DRGYDRILRA 
KVGELAPGGP VLPLLDASVV DRLREDPSQG PALSRTELEL ALKLDAWLTR WRLTLPG