Gene Sros_9344 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_9344
Symbol
ID	8672695
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	10293242
End bp	10294690
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	70%
IMG OID
Product	Argininosuccinate synthase
Protein accession	YP_003344705
Protein GI	271970509
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.34089
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAAGG TTCTCACCTC CCTGCCGACC GGCGAACGCG TCGGCATCGC CTTCTCGGGC 
GGCCTCGACA CCTCGGTCGC CGTCGCGTGG ATGCGCGACA AGGGTGCCGT CCCGTGCACC 
TACACCGCCG ACATCGGCCA GTACGACGAG CCCGACATCG CCTCGGTGCC CGGCCGCGCG 
CTGGCGTACG GTGCCGAGGT CGCGCGCCTG GTCGACTGCC GCGCGGCACT GGTCGAGGAG 
GGCCTGGCCG CGCTCACCTG CGGCGCGTTC CACATCCGCT CGGCCGGGCG CACCTACTTC 
AACACCACGC CGCTCGGCCG TGCCGTCACC GGGACCCTGC TGGTCCGGGC GATGATCGAG 
GACGACGTAC AGATCTGGGG CGACGGCTCG ACGTTCAAGG GCAACGACAT CGAGCGGTTC 
TACCGGTACG GCCTGCTCGC AAACCCCCAC CTGCGCATCT ACAAGCCCTG GCTGGACGCG 
GACTTCGTGT CCGAGCTCGG CGGCCGCAAG GAGATGTCGG AGTGGCTGCT CGCCCACGAC 
CTGCCCTACC GTGACAGCAC CGAGAAGGCC TACTCGACCG ACGCCAACAT CTGGGGCGCC 
ACCCACGAGG CCAAGACCCT GGAGCACCTC GACACCGGTA TCGAGACCGT GGACCCGATC 
ATGGGCGTGC GGTTCTGGGA CCCCGCGGTC GAGATCGCGA CCGAGGACGT GACCATCGGC 
TTCGACCAGG GCCGCCCGGT GACGATCAAC GGCAAGGAGT TCGCCACCCC GGTCGACCTG 
GTGATGGAGG CGAACACGAT CGGCGGACGG CATGGCATGG GCATGTCGGA CCAGATCGAG 
AACCGGGTGA TCGAGGCCAA GAGCCGCGGC ATCTACGAGG CCCCCGGGAT GGCGTTGCTG 
CACGCGGCGT ACGAACGGCT GGTCAACGCG ATCCACAACG AGGACACCCT GGCGAGCTAC 
CACAACGAGG GACGGCGGCT CGGCCGGCTG ATGTACGAGG GCCGCTGGCT CGACCCGCAG 
GCGCTGATGC TGCGCGAGTC GCTGCAGCGC TGGGTCGGCA CGGCGGTCAT CGGCGAGGTG 
ACGCTGCGGC TGCGGCGCGG TGAGGACTAC TCGATCCTGG ACACCTCCGG CCCGGCCTTC 
AGCTACCACC CGGACAAGCT GTCGATGGAG CGCACCGAGG ACTCGGCGTT CGGTCCGGTG 
GACCGGATCG GCCAGCTCAC CATGCGCAAC CTCGACATCG CCGACTCGCG CGCCAAGCTT 
GAGCAGTACG CCAGCCTCGG CATGGTCGGC ACCACCCACC CCGCGCTCAT CGGTGCCGCC 
CAGGCGGCCT CGACCGGACT GATCGGCGCG ATGCCGCAGG GCGGCGCCGA GGCCATCGCC 
TCACGCGGCA CGGTCTCCGA TGAAGACGCG ATGCTCGACC GCGCCGCGAT GGAGTCCGGC 
ACCGACTGA

Protein sequence

MSKVLTSLPT GERVGIAFSG GLDTSVAVAW MRDKGAVPCT YTADIGQYDE PDIASVPGRA 
LAYGAEVARL VDCRAALVEE GLAALTCGAF HIRSAGRTYF NTTPLGRAVT GTLLVRAMIE 
DDVQIWGDGS TFKGNDIERF YRYGLLANPH LRIYKPWLDA DFVSELGGRK EMSEWLLAHD 
LPYRDSTEKA YSTDANIWGA THEAKTLEHL DTGIETVDPI MGVRFWDPAV EIATEDVTIG 
FDQGRPVTIN GKEFATPVDL VMEANTIGGR HGMGMSDQIE NRVIEAKSRG IYEAPGMALL 
HAAYERLVNA IHNEDTLASY HNEGRRLGRL MYEGRWLDPQ ALMLRESLQR WVGTAVIGEV 
TLRLRRGEDY SILDTSGPAF SYHPDKLSME RTEDSAFGPV DRIGQLTMRN LDIADSRAKL 
EQYASLGMVG TTHPALIGAA QAASTGLIGA MPQGGAEAIA SRGTVSDEDA MLDRAAMESG 
TD