Gene Sros_2800 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_2800
Symbol
ID	8666086
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	3039569
End bp	3040813
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	67%
IMG OID
Product	Arginine deiminase
Protein accession	YP_003338501
Protein GI	271964305
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.551978
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTTTC ATGTCGACTC CGAGGTGGGC AGGCTCCACC GGGTCCTGCT GCACAAGCCC 
GAACTGGCAC TCAAGCGGCT CACCCCCTCG AACAAGGACG AATTCCTCTT CGACGACGTG 
CTGTGGGTGC AACGGGCGGT GGAGGAGCAC GAGCGGTTCC AGCAGGTGCT GCGCGAGCGC 
GGCATCACCG TCTACATGCT GGCCGACCTG CTGCGCGAGA CGGTCGACAT CCCCGAGGCC 
CGCAAACACA TCCTGGACAG GACCTTCGAC GAGCACTACT TCGGGCCGAT GGCCATCGAC 
GCCCTCCGCA ACGTGTTCGA CGCGATGGAC TCCGCCGAAC TCCAGCTCTA CCTCACCGGC 
GGCATCACCA AGCGCGAACT GGTGGAGCGG GGCACCGACC CCAAGAGCCT GGCCTTCCAC 
ACCCTGGAGT ACGACGACTT CATCCTGCCG CCGCTGCCCA ACCACCTGTT CACCCGCGAC 
ACCTCCTGCT GGATCTACGA CGGCGTCTCC ATCAACGCGA TGAAGAAGAA GGCCCGCCAG 
CGCGAGACCG TGAACTACGA GGCCGTCTAC CGCTACCACC CGATGTTCGC CGCCGGCTAC 
GACCGGCCCG GACAGGGCGG CTACAACGTC TGGATGCCGG GCCTGGCCGC GGCGCCGGCC 
ACCATCGAGG GCGGCGACGT GCTGGTCATC GGCCGGGAGA CGGTGCTGGT CGGGATGAGC 
GAGCGCACCC AGCCACAGGC GGTGGAGATG CTCGCGCGCA GCCTGTTCCA CAAGGGCTCG 
GCGAAGAGGA TCGTCGCGCT GAACATGCCG AAGGCCCGGG CGTTCATGCA CCTGGACACG 
GTGATGACGA ACGTGGACGT CGGCGTGTTC ACCAAGTACG CCGGCCTGGG CATGCTGCCC 
TCCTACACGG TCGAACCCGG TGACACCGAG AAGGAACTCA AGATCACCGA CCATCCCGCG 
GAGGACATGC ACAAGGCCAT CGCGCGGGCA CTCGGCCTGG ACGACATCAA GGTCCTCACC 
CCCACCCAGG ACGTCTACGC CGCCGAGCGG GAGCAGTGGG ACGACGGCTG CAACGTCCTG 
GCCGTCGAAC CCGGCGTCGT CATCGCCTAC GAGCGCAACA CCACCACCAA CAACTACCTG 
CGCGCCAACG GCATCGAGGT GATCACGACC CCGGGCAGCG AGCTCGGCCG GGGCCGGGGC 
GGGCCGCGCT GCATGAGCTG CCCGCTCGAA CGCGACGGCA TCTGA

Protein sequence

MTFHVDSEVG RLHRVLLHKP ELALKRLTPS NKDEFLFDDV LWVQRAVEEH ERFQQVLRER 
GITVYMLADL LRETVDIPEA RKHILDRTFD EHYFGPMAID ALRNVFDAMD SAELQLYLTG 
GITKRELVER GTDPKSLAFH TLEYDDFILP PLPNHLFTRD TSCWIYDGVS INAMKKKARQ 
RETVNYEAVY RYHPMFAAGY DRPGQGGYNV WMPGLAAAPA TIEGGDVLVI GRETVLVGMS 
ERTQPQAVEM LARSLFHKGS AKRIVALNMP KARAFMHLDT VMTNVDVGVF TKYAGLGMLP 
SYTVEPGDTE KELKITDHPA EDMHKAIARA LGLDDIKVLT PTQDVYAAER EQWDDGCNVL 
AVEPGVVIAY ERNTTTNNYL RANGIEVITT PGSELGRGRG GPRCMSCPLE RDGI