Gene MCA1784 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA1784
Symbol	purB
ID	3102876
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	-
Start bp	1914052
End bp	1915413
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	63%
IMG OID	637170944
Product	adenylosuccinate lyase
Protein accession	YP_114222
Protein GI	53804158
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0015] Adenylosuccinate lyase
TIGRFAM ID	[TIGR00928] adenylosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.47541
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACTCCA TCAAGGCATT GTCGCCAGTA GACGGCCGTT ACGCCGGCAA GGCCGACGCC 
CTCCGCAACA CCTTCAGTGA ATACGGCCTC ATCCGGTTCC GGATCCTGGT CGAATTGCGC 
TGGCTGGAGG CGCTGGCGGC CGAGCCCACG ATCACCGAGG TTCCCCCTTT GAGTGGCGAA 
GCGCGCGATC GTCTGAACCG GATCGTGGAC GAATTCGGCG AAGATCATGC CGAACGGGTC 
AAGACCATCG AGCGGACCAC CAACCACGAC GTCAAGGCGG TCGAATATTT CCTGAAGGAG 
AGGATCCAGG GCTGCCCCGA ACTGGAGCGG ATCGCCGAGT TCATCCATTT CGCCTGCACC 
TCTGAAGACA TCAACAATCT TGCCTATGGG CTGATGGTGA AGGAGGCGCG TGACACGGTC 
CTGCTGCCGG CGATGGACGA GTTGATCGAG GCGGTGCGGG AGCGGGCGCA TGTCTATGCC 
GGCCAGCCGA TGCTTTCGCG CACTCACGGC CAGCCGGCGA CGCCCACCAC GGTCGGGAAG 
GAGTTCGCCA ACTTCGCCGC CCGGCTGGCT CGCCAACGCG AGCAAGTAGC GGCGGTGGCC 
CTGATGGGCA AGATCAACGG TGCGGTCGGC AATTTCAACG CCCATGCGGT CGCCTACCCC 
GAAGTCGATT GGCCCAAACT GGCACAAGGT TTCGTCGAGT CGCTGGGGCT GGCCTGGAAC 
CCTTATACCA TACAGATCGA GCCACACGAT TATCTGGCCG AGCTGTGCCA TGCCTACAGC 
CGTTTCGGCA CCGTGCTGAT CGACTTCGAC CGCGACGTCT GGGGCTACAT CTCGCTGGGT 
TTTTTCCGGC AGAAGACCGT GGCCGGCGAA GTCGGCTCTT CCACCATGCC GCACAAGGTC 
AACCCGATCG ATTTCGAGAA CTCGGAAGGC AACCTCGGTA TCGCCAACGC GCTGTTCTCG 
CATTTCGCCG AAAAGCTGCC GATTTCCCGC TGGCAGCGCG ATCTAACCGA CTCCACGGTG 
CTGCGCAATT TCGGCGTCGG CCTCGCCCAT CTGCTCATCG CGCTCGGTTC CACTCTGAAA 
GGCCTGGGCA AGCTGGAGCT GAGCCCTCCG GTCCTGGAGG CCGATCTCGA CGGCAACTGG 
GAAGTGCTGG CCGAGGCGAT CCAGACCGTG ATGCGCCGCT ATGGCGTGGA ACGGCCCTAC 
GAGAAGCTCA AGGCCTTGAC CCGCGGCCAG CGGGTGGACG CGGAGGGCCT GCGTGCCTTC 
GTAGAGACCC TGGAGATACC CGAGGAGGCG CGCAGCCGCC TGGCAGCGCT GGCTCCCCGC 
GATTACATCG GCTACGCTGA AACCTTCGCC AAAACCATCT GA

Protein sequence

MNSIKALSPV DGRYAGKADA LRNTFSEYGL IRFRILVELR WLEALAAEPT ITEVPPLSGE 
ARDRLNRIVD EFGEDHAERV KTIERTTNHD VKAVEYFLKE RIQGCPELER IAEFIHFACT 
SEDINNLAYG LMVKEARDTV LLPAMDELIE AVRERAHVYA GQPMLSRTHG QPATPTTVGK 
EFANFAARLA RQREQVAAVA LMGKINGAVG NFNAHAVAYP EVDWPKLAQG FVESLGLAWN 
PYTIQIEPHD YLAELCHAYS RFGTVLIDFD RDVWGYISLG FFRQKTVAGE VGSSTMPHKV 
NPIDFENSEG NLGIANALFS HFAEKLPISR WQRDLTDSTV LRNFGVGLAH LLIALGSTLK 
GLGKLELSPP VLEADLDGNW EVLAEAIQTV MRRYGVERPY EKLKALTRGQ RVDAEGLRAF 
VETLEIPEEA RSRLAALAPR DYIGYAETFA KTI