Gene Moth_2309 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2309
Symbol
ID	3831423
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2428386
End bp	2429669
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	62%
IMG OID	637830233
Product	adenylosuccinate synthetase
Protein accession	YP_431139
Protein GI	83591130
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0104] Adenylosuccinate synthase
TIGRFAM ID	[TIGR00184] adenylosuccinate synthase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0139427
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGCGG TAGTACTGGT TGGCGCCCAG TGGGGCGATG AAGGTAAGGG AAAAATCACA 
GACTACCTGG CTGAAAGGGC CGATGTGGTG ATTCGCTACC AGGGAGGTAG CAACGCCGGC 
CATACGGTAA TGGTCGGCCA TGAGGAATTT AAACTGCACC TGGTGCCTTC GGGTATCCTC 
TACCCCGGCA AGCTCTGTAT TATCGGTAAC GGTGTAGTCC TCGACCCGGC GGTCCTGGTG 
GAGGAGTTAG ACGGCCTGGC GGCCCGGGGC GTGGATACCT CCGGTCTGAA GATCAGCAAC 
CGGGCTCACC TGATCCTTCC CTACCACAAA GGCCTGGACG CCGCCGAGGA GGAACACCGC 
GGTGCGGCCA TGATTGGCAC CACCAAAAGG GGTATCGGCC CGGCCTATGT GGATAAAGCC 
GCCCGGACGG GTATCCGGGT GGGCGACCTC CTGGACTGGG AGGAGTTTAG CGCCAAAGTG 
GCCCATAACC TGGCTGCCAC CAATGAACTC CTGGCTAAGA TTTATGACCG GCCGGGATAT 
GATCTCCAGG CCATCCTGGA GGAATACGCC GGTTACGCCC GGCGCCTGCG GCCGCTGATT 
GCCGACAGCG TTCGCCTGGT GAACCGGGCC CTCCAGGAGG GGCGTAAGGT TCTCTTTGAA 
GGCGCCCAGG GGACCCTCCT GGACCTGGAT CAGGGAACCT ATCCCTTTGT GACTTCATCC 
TATCCCGTTG CCGGCGGGGC CTGCATCGGC GCCGGCGTCG GCCCGACACG CATCGACAAG 
GTCATTGGCG TGGTCAAGGC CTATACCACC AGGGTGGGTT CCGGCCCCTT CCCTACGGAG 
ATTACCGGGC CTGCCGGTGA CGCCCTGAGG CAACAGGGCA TGGAATTCGG TACCACCACC 
GGGCGACCGC GCCGCTGCGG CTGGCTGGAT ACGGTTATCC TGCGCCATGC TGCCGAGGTA 
AACGGCCTGA CGGGTATCGC CCTGACCAAG CTGGACGTCC TGACGGGCCT TGATCCTTTA 
AGAATTTGTA CCAGTTACCG CTACCGGGGG ACGGTGGGGG AAGATTTTCC GGCCAGCCTG 
AAGGCATTAG AGGAGTGCGA ACCGGTTTAT GAGGAACTCC CGGGCTGGCA CGAAGACATT 
ACCGGCGCTA GGTCCCTGGA TGACCTCCCG GCTAATTGCC GCCGTTATAT CCGGCGGCTG 
GAAGAGCTCA CCGGCGTTCC CGTCCACCTC ATCGCCGTGG GCCCGCGCCG GGACCAGACC 
ATTGTTTTGG AGAGTCCTTT TTAA

Protein sequence

MAAVVLVGAQ WGDEGKGKIT DYLAERADVV IRYQGGSNAG HTVMVGHEEF KLHLVPSGIL 
YPGKLCIIGN GVVLDPAVLV EELDGLAARG VDTSGLKISN RAHLILPYHK GLDAAEEEHR 
GAAMIGTTKR GIGPAYVDKA ARTGIRVGDL LDWEEFSAKV AHNLAATNEL LAKIYDRPGY 
DLQAILEEYA GYARRLRPLI ADSVRLVNRA LQEGRKVLFE GAQGTLLDLD QGTYPFVTSS 
YPVAGGACIG AGVGPTRIDK VIGVVKAYTT RVGSGPFPTE ITGPAGDALR QQGMEFGTTT 
GRPRRCGWLD TVILRHAAEV NGLTGIALTK LDVLTGLDPL RICTSYRYRG TVGEDFPASL 
KALEECEPVY EELPGWHEDI TGARSLDDLP ANCRRYIRRL EELTGVPVHL IAVGPRRDQT 
IVLESPF