Gene Msed_1987 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1987
Symbol
ID	5103374
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	1921012
End bp	1922187
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	50%
IMG OID	640507875
Product	argininosuccinate synthase
Protein accession	YP_001192051
Protein GI	146304735
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0137] Argininosuccinate synthase
TIGRFAM ID	[TIGR00032] argininosuccinate synthase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.118414
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATAG TCCTAGCCTA TTCAGGAGGT TTAGATACAA CTGTTGCGAT AAAGTGGTTA 
AGTGAGACCT TTCACGCCGA AGTGATAAGC GTAAGCGTCG ATGTAGGACA GAAGGACGAC 
TTTAAGAAAA TTGAGGAAAG AGCGTACAAG GCTGGAAGTG CTAAGCATTA CCTAGTGGAT 
GCCAAGAGGG AGTTTGCTGA AAACTTCGCT CTGAAGGACA TTAAGATGAA CGGCCTTTAT 
GAGGAGGTGT ACCCGCTTGC CACTGCGCTC GCGAGACCAC TCATAGCCGA GAAGGTCGCT 
GAGGTTGCGA AAAAGGAAGG CACAGAATAT GTTGCGCACG GGTCTACATC CAAGGGGAAT 
GACCAGGTTA GGTTTGACCT GGCCCTTAAG ACAGCGTTAG ATAACGTCAA GATAATAGCT 
CCAGCCAGGA TCTGGAAGAT GACAAGGGAG GATGAAATAG CCTACGCCAG GGAAAGGGGA 
ATTCCCATAA AGACCGAGAG CAGTAAGTAC AGTATTGATG AAAACCTTTG GGGGAGAAGC 
ATAGAGGGGG ACATAATCTC GGATCCCGCG TCAGAGGTTC CAGAGGACGC ATTTGAGTGG 
ACTGCTGTGA GGAAACAAGA CAAACTGAAG TTGAGCGTGG AGTTCGAGAA AGGAGTTCCC 
GTTAGAGTTA ACGGCGAGAA GCTTGATCCG GTTAAGCTCA TTTCCCTGTT GAACGAGGAG 
GTAGGATCCA GGGGATTCGG AAGGGTAGAA CACCTTGAGA ACAGGGTAGT TGGTTTCAAG 
TCAAGGGAGG TGTATGAGGC ACCCGCAGCT CTAGCCCTCA TAGCGGCGCA TAAGGATCTG 
GAAAAAACTG TCCTCACTCC CTTGGAGCTC AGGTTCAAGA GACACCTTGA CTCCTTGTGG 
TCTGATCTAG TGTACCAGGG ACTCTGGTAT GAACCGCTGA GGAATACCCT TGAGCTCGCA 
GGAGATGAGA TAAACAAGTG GGTCTCCGGA GAGGTTAAGC TAGAAGTGGA CCTGAAGAGT 
CTCAGGGTAG TGGGTAGGAC CTCTCCTTAC TCGCCATACT CAGAAAAAAT ATCCTCCTAC 
AACAAGGGAT GGTATCCCTC GGATGAGGAG GCCAGAGGGT TCATTGAGAT CTGGGGAATG 
CACTCCCTAC TAACAAGGAA GGCGAGGTAT GGCTAA

Protein sequence

MKIVLAYSGG LDTTVAIKWL SETFHAEVIS VSVDVGQKDD FKKIEERAYK AGSAKHYLVD 
AKREFAENFA LKDIKMNGLY EEVYPLATAL ARPLIAEKVA EVAKKEGTEY VAHGSTSKGN 
DQVRFDLALK TALDNVKIIA PARIWKMTRE DEIAYARERG IPIKTESSKY SIDENLWGRS 
IEGDIISDPA SEVPEDAFEW TAVRKQDKLK LSVEFEKGVP VRVNGEKLDP VKLISLLNEE 
VGSRGFGRVE HLENRVVGFK SREVYEAPAA LALIAAHKDL EKTVLTPLEL RFKRHLDSLW 
SDLVYQGLWY EPLRNTLELA GDEINKWVSG EVKLEVDLKS LRVVGRTSPY SPYSEKISSY 
NKGWYPSDEE ARGFIEIWGM HSLLTRKARY G