Gene Mlg_0601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0601
Symbol
ID	4268480
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	653585
End bp	654793
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	65%
IMG OID	638125348
Product	argininosuccinate synthase
Protein accession	YP_741445
Protein GI	114319762
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0137] Argininosuccinate synthase
TIGRFAM ID	[TIGR00032] argininosuccinate synthase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.000000000197496
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCGACG TCAAGAAGGT GGTGCTCGCC TATTCCGGCG GTCTCGACAC CTCGGTCATC 
CTGCAATGGC TGCGCGAGAC CTACGACTGC GAGGTGGTGA CCTTCACCGC CGACCTGGGG 
CAGGGCGAGG AGCTGGAGCC GGCACGCAAG AAGGCCGAGG CCTTTGGCAT CAAAGAGATC 
TACATCGACG ATCTGCGCGA GGAGTTCGTC CGCGATTTCG TCTTCCCCAT GTTCCGGGCC 
AACGCCATCT ACGAGGGTGA GTACCTGCTC GGCACCTCCA TCGCCCGGCC GCTGATCGCC 
AAACGCCAGG TGGAGATCGC CCGCGAGACC GGCGCCGACG CCGTCTCCCA CGGGGCCACC 
GGCAAGGGCA ACGACCAGGT GCGCTTCGAG CTCGGCTACT ACGGCCTGGA GCCGAACATT 
AAGGTGATCG CCCCCTGGCG CGAATGGGAT CTCAACTCCC GCGAGAAGCT GCTGGCCTAC 
GCCGAGAAGC ACGGCATCTC CATCGAGGGC AAGCAGTCCG GCGGCTCGCC CTACTCCATG 
GACGCGAACC TGTTGCACAT CTCCTACGAG GGCGGGGTCC TGGAGGACAC TTGGACCGAG 
TGCGAGGAGG CCATGTGGCG CTGGACGCGC TCGCCCGAGG CGGCCCCGGA CGAGGCCCAA 
TATATCGACA TCGAGTTTCA GGGCGGCGAC CCGGTGAGTA TCGACGGCGA GAAGCTCAGC 
CCCGCCGCGC TGCTGAGCCG GCTCAACGAC CTGGGCGCCA TGCACGGCGT TGGCCGGATC 
GATATCGTCG AGAACCGCTA TGTGGGCATG AAGTCCCGCG GCTGCTACGA AACCCCGGGC 
GGCACCATCC TGCTGCGCGC CCACCGGGCC ATCGAGTCCA TCACCCTGGA CCGCGAGAGC 
GCCCACCTGA AGGACGAGGT GATGCCCAAG TACGCCGAGT TGATCTACAA CGGCTACTGG 
TGGAGCCCGG AGCGCGAGGC CATGCAGGCG TTGATCGATG CCACCCAGCG CCGGGTCAAC 
GGCGTGGTGC GGCTGAAGCT CTACAAGGGG AATGTCATTG TGGTGGGACG CGATTCCGCG 
AACGATTCGC TGTTCGACCA GACCATTGCC ACCTTCGAGG ATGATCGCGG CGCCTACGAT 
CAGAAGGACG CCGAGGGCTT TATCCGCCTC AACGCCCTGC GCCTGCGTAT CGCCCAGCGG 
CGCGGCTGA

Protein sequence

MSDVKKVVLA YSGGLDTSVI LQWLRETYDC EVVTFTADLG QGEELEPARK KAEAFGIKEI 
YIDDLREEFV RDFVFPMFRA NAIYEGEYLL GTSIARPLIA KRQVEIARET GADAVSHGAT 
GKGNDQVRFE LGYYGLEPNI KVIAPWREWD LNSREKLLAY AEKHGISIEG KQSGGSPYSM 
DANLLHISYE GGVLEDTWTE CEEAMWRWTR SPEAAPDEAQ YIDIEFQGGD PVSIDGEKLS 
PAALLSRLND LGAMHGVGRI DIVENRYVGM KSRGCYETPG GTILLRAHRA IESITLDRES 
AHLKDEVMPK YAELIYNGYW WSPEREAMQA LIDATQRRVN GVVRLKLYKG NVIVVGRDSA 
NDSLFDQTIA TFEDDRGAYD QKDAEGFIRL NALRLRIAQR RG