Gene Sros_3978 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3978
Symbol
ID	8667272
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	4431758
End bp	4433017
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	68%
IMG OID
Product	Arginine deiminase
Protein accession	YP_003339631
Protein GI	271965435
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.103807
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACTG CAGCCTTCGG CGTGCACTCC GAGGTCGGCC CCCTCCGCAA GGTCATCGTC 
CACCGGCCCG ACATGAGCCT GAAACGGCTG ACCCCCACCA ACAACGACAA GCTGCTCTTC 
GACGACATCC TGTGGGTCGA GCACGCCCAG AAGGAGCACG ACAGGTTCGT CACCCTGATG 
CGCGAGCGCG GCGTCGAGGT GTTCTACCAC CAGGAACTGC TGGCACAGGC GCTGGAGGCG 
ACCCCCCACG CCAAGCGGAA CGCCGTCGAG CAGGCCGTCA CCCATCTGAC CGTCGGCCCC 
GCCCTGGTGG ACGCCGTCCG TGAGGAGCTG TCCACCTGGA GCGGCAAGGA CCTGGCCACC 
CACCTCATCG GCGGGCTGAC CAAGGAGGAG TTCGACGTCC GCGGGTTCGA CACCCGGTCC 
CTGGTCGCCG CCTCGGCGGA CCCGCAGCAG TTCGTGCTCC CGCCGCTGCC CAACTCCCTC 
TACCAGCGCG ACCCCGCCGC CTGGCTGTAC GGCGGCGTCT CGCTCAACCC GATGTTCTGG 
CACGCGCGCC TGCTGGAGAC CATGAACCAG AGCACGATCT ACCACAACCA CCCGATGTTC 
ACCGGCGAGG ACTTCTCCTA CTGGTACCCG CCGAGCGGCG ACGAGGCCGA CTTCGACGAG 
GAGGACTTCG GCAAGGCCGC GCTGGAGGGC GGCGACATGA TGCCCATCGG CAACGGGACC 
GTGGTCATCG GCATCAGCGA GCGGAGCACC CCGCAGATGA TCGAGCACAT CGCCCTGGCG 
ACCTTCGCCG CCGGGGCGGC CGAGCGCGTC ATCGCCGTCA ACGTCCCCAA GCGCCGCTCC 
TACATGCACC TGGACACCGT GTTCACCTTC CTGGACGTCG ACAAGGCCTC CGCCTACCTG 
CCCTTCCTGG AGACGGCCGT CACCCACTCG CTGCGTCCCG GCGACAGGGA CCGGACTCTG 
GACGTCCGCC CCGAGAGGGG CTTCGTCGAC GCCGTCGAGG ACGCGCTGGC CATCTCCCGG 
CTCGACATCA TCCCCACCGG CGGGGACGAC AGCCAACAGG CCCGGGAGCA GTGGGACTCC 
GGCAACAACT TCTTCGCCCT CGAACCCGGC GTCGTCGTCG GCTACCACAA GAACCAGTTC 
ACCAACCGCA AGCTGCGCCA GCACGGCGTC GACGTCATCG AGATCGAGGG CTTCGAACTG 
GGCAAGGGCC GGGGCGGCAC CCACTGCATG ACCTGCCCCA TCCTGCGTGA GGGCATCTGA

Protein sequence

MTTAAFGVHS EVGPLRKVIV HRPDMSLKRL TPTNNDKLLF DDILWVEHAQ KEHDRFVTLM 
RERGVEVFYH QELLAQALEA TPHAKRNAVE QAVTHLTVGP ALVDAVREEL STWSGKDLAT 
HLIGGLTKEE FDVRGFDTRS LVAASADPQQ FVLPPLPNSL YQRDPAAWLY GGVSLNPMFW 
HARLLETMNQ STIYHNHPMF TGEDFSYWYP PSGDEADFDE EDFGKAALEG GDMMPIGNGT 
VVIGISERST PQMIEHIALA TFAAGAAERV IAVNVPKRRS YMHLDTVFTF LDVDKASAYL 
PFLETAVTHS LRPGDRDRTL DVRPERGFVD AVEDALAISR LDIIPTGGDD SQQAREQWDS 
GNNFFALEPG VVVGYHKNQF TNRKLRQHGV DVIEIEGFEL GKGRGGTHCM TCPILREGI