Gene Moth_2285 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2285
Symbol
ID	3831317
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2396761
End bp	2397987
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	58%
IMG OID	637830205
Product	argininosuccinate synthase
Protein accession	YP_431115
Protein GI	83591106
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0137] Argininosuccinate synthase
TIGRFAM ID	[TIGR00032] argininosuccinate synthase

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.117848
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGGAG TCTTTACTGT GGCCGAAAAG GTAGTTCTCG CCTATTCCGG CGGGCTGGAT 
ACCTCCATTA TTATCCCCTG GCTCAAGGAA ACCTATGGTT ATGAGGTTAT CGCCGTGGCC 
GTCGATGTCG GCCAGGGAGA AGAGCTGGAA CCCCTGGAGG AAAAGGCTAT AAAGAGCGGG 
GCCAGCAAGA TCTATATTCT GGATAAAAAG AAGGAGTTTG TGGAGGAGTA CATCTGGCCC 
ACCCTCAAGG CCGGCGCTGT TTACGAGGGC AAGTACCTCC TGGGCACCTC CTTCGCCCGG 
CCCCTCATTG CCAAATGCCT GGTGGAGGTC GCCGCACAGG AAGGGGCCAC GGCCGTGGCC 
CACGGAGCCA CCGGCAAGGG CAACGACCAG GTGCGTTTCG AACTGGGGGT TAAGGCCTTA 
AATCCCCAGC TAAAGGTCAT CGCTCCCTGG CGGATCTGGA ACATCCGCTC CCGGGAAGAG 
GCCATGGACT ACGCCGCCGC CCGGGGCATC CCGGTGCCGG TGACTAAAGA CCGGCCCTAC 
AGCATGGACC GTAACCTCTG GCACTTGAGC CACGAGGGAG GCGATCTCGA GGATCCCTGG 
AATGCACCCG GGGACGACCT TTACCTGATA ATCACCCCGC CGGAACAGGC CCCGGATAAA 
CCGACTTATG TAACCATCGA CTTTGAAAAG GGTATTCCGG TAGCCGTGGA CGGGGAAAAA 
CTGGACGCCG TCGCCCTGGT GGAGAAGCTC AATGACCTGG CGGCGGCCAA CGGTGTGGGC 
ATAGTTGACA TTGTAGAAAA TCGCCTGGTT GGTATGAAGT CCCGGGGCGT TTATGAAACC 
CCCGGGGGGA CGATCCTCTA TACAGCCCAC CGGGAACTGG AGTACCTCAC CCTGGACCGC 
ATGACCATGC ATTTCAAAGA AATGGTGGCC GCCAAGTACG CCGAGCTGGT TTACGACGGC 
AACTGGTTCT CACCCTTGAA AAAAGCCCTG GACGCCTTTG TGGACAGCAC CCAGGAGACG 
GTGACGGGCA CGGTGCGTCT AAAACTCTAT AAAGGCAGCT GCACCCCGGC CGGGGTCAAA 
TCACCTTATT CCATCTACAA CGAGGACCTG GTCACCTTCG GTGCCGGCGG TGACTACGAC 
CATAAGGACG CCACCGGTTT CATCAACCTC TTCGGCCTGC CCTTGAAGGT ACGGGCGCTG 
ATGGAACAAA AAACTGGACT GAGATAG

Protein sequence

MKGVFTVAEK VVLAYSGGLD TSIIIPWLKE TYGYEVIAVA VDVGQGEELE PLEEKAIKSG 
ASKIYILDKK KEFVEEYIWP TLKAGAVYEG KYLLGTSFAR PLIAKCLVEV AAQEGATAVA 
HGATGKGNDQ VRFELGVKAL NPQLKVIAPW RIWNIRSREE AMDYAAARGI PVPVTKDRPY 
SMDRNLWHLS HEGGDLEDPW NAPGDDLYLI ITPPEQAPDK PTYVTIDFEK GIPVAVDGEK 
LDAVALVEKL NDLAAANGVG IVDIVENRLV GMKSRGVYET PGGTILYTAH RELEYLTLDR 
MTMHFKEMVA AKYAELVYDG NWFSPLKKAL DAFVDSTQET VTGTVRLKLY KGSCTPAGVK 
SPYSIYNEDL VTFGAGGDYD HKDATGFINL FGLPLKVRAL MEQKTGLR