Gene Msed_0874 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0874
Symbol
ID	5103520
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	807395
End bp	808528
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	43%
IMG OID	640506777
Product	arginine deiminase
Protein accession	YP_001190970
Protein GI	146303654
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2235] Arginine deiminase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATACAGG TCCAGGTTAA GGCAGAGTAT AGCCCACTTA GGAAAGTAGT CGTGGCAACT 
CCAGGAAATG AGAAAACTAG GTTAACTCCA AAGACGCTTT ACGAGCTACA ATATGCAGAA 
ATTCCCGATC CAGTAGAGCT GAAACTGGAG CACGACGAGT TTGTGAAGAA GTTAAGGGAG 
AACGGAGCTG AGGTCATAAA CCTGAGGGAA GAGGTCATGA AGCTTAAGGA GGAAGAATTG 
GTCGCTCTAA TAAAGTCTAG TAGCGAGTGT GATATTTTAC TAGACAACCT CGATAAAGAG 
TTGATGGCCG AGATACTGAT CTCCGGCCTG ACTGCTAAGG AGGCAAAGGA AATGGGAGCC 
AACGTCTTAA TTCCCGAAAA TGAAGAATTT TGCGTAAAAC CATTAGTTAA TATCATGTTT 
ACAAGGGATC CAGGGATGGT ACTGGGAGGC ACGTATGTCT CTGGAAAGAT GAGATGGGAG 
TCGAGAAGAA GGGAGCCAGA GATCTTCACC GCGATACTTA AACCTAAAAA TGTATTGAAA 
GTGGAAAAAG GATTCTTCGA GGGAGGAGAT TTCTTTCCAC TAGACGGGAG GCTTCTCATG 
GGATTTGGAA CCAGAAGTAG TGGGTTAGGA CTTAGTTACA CTGTCCCTAA ACTCATGGAG 
AGTGGAGAAA TTGATGAGGC TATACTGGTA AAGCTGGACA CACCAGAACT TCATCCCAAC 
AAGGGTATAG GTCATTTAGA CACTGTTATG GGTATCCCAG CCCAGGACGT TATAGTCTAT 
TACAAGTCTC TTCTTGATAA ATCGAGCGTT TACCTATATA AAGGGAAGGA GATAGTGCGG 
GACAATAGGG TTCTCAGCGA AGTGATGAAG GATTATTTGG GTCACGATCT AAGGATTGTC 
AATATAGGGA ATGCTGAATA TTATGCTGAA GAGAGGGAAC ATTGGCTTCT AGCTAGTAAT 
ATTATTGTAG TAGGTAAAAA CAAGATCATA GCCTATGAAC ATAACAGACT GACCAATAGG 
CTCATGACGG AGGCGGGTAT AGAGATTATA ACATTCAAAG GAAATGAAAT TATAAAGGAG 
GGCGGAGAGC GGAGCGGTCC TAGATGCATG ACACTCCCAC TGCAAAAGTA TTGA

Protein sequence

MIQVQVKAEY SPLRKVVVAT PGNEKTRLTP KTLYELQYAE IPDPVELKLE HDEFVKKLRE 
NGAEVINLRE EVMKLKEEEL VALIKSSSEC DILLDNLDKE LMAEILISGL TAKEAKEMGA 
NVLIPENEEF CVKPLVNIMF TRDPGMVLGG TYVSGKMRWE SRRREPEIFT AILKPKNVLK 
VEKGFFEGGD FFPLDGRLLM GFGTRSSGLG LSYTVPKLME SGEIDEAILV KLDTPELHPN 
KGIGHLDTVM GIPAQDVIVY YKSLLDKSSV YLYKGKEIVR DNRVLSEVMK DYLGHDLRIV 
NIGNAEYYAE EREHWLLASN IIVVGKNKII AYEHNRLTNR LMTEAGIEII TFKGNEIIKE 
GGERSGPRCM TLPLQKY