Gene Mmwyl1_1075 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmwyl1_1075
Symbol
ID	5368782
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Marinomonas sp. MWYL1
Kingdom	Bacteria
Replicon accession	NC_009654
Strand	-
Start bp	1199487
End bp	1200554
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	43%
IMG OID	640803416
Product	phosphoribosylaminoimidazole carboxylase ATPase subunit
Protein accession	YP_001339941
Protein GI	152995106
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0026] Phosphoribosylaminoimidazole carboxylase (NCAIR synthetase)
TIGRFAM ID	[TIGR01161] phosphoribosylaminoimidazole carboxylase, PurK protein

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.347968
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00000316838
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCAGTTC TATGGGTATT AGGAGCAGGT CAATTAGGCG CTATGCTAAA ACAAGCAGGA 
ACGCCGCTTG GCATTGATGT GCGTCCAGTA GATATTGAGT CAACCGAAAC CTTAGCGTTA 
GCTCCAACTG ACATTGTGAC AGCAGAAAGA GAAGAATGGC CAGAAACCAT CGCCACCAAA 
CAACTTGCTA CTCACAGTAA TTTTGTCAAC CTAGCCACCT TTCCACAACT TGCAGATCGT 
CTAACCCAGA AACAATGGTT AGATCGTCTT GAGCTAGCGA CAGCACCATG GTTTCCGGTT 
GAGATTGACT CTTCTGCAAC ACACTCCTAT GAAACATTAG GTGAACGCGT TCTGATGAAA 
CGTCGTCGAG GTGGTTATGA TGGCAAAGGT CAATATTGGT TAAAACAATC TGAGGGCATT 
GAGATACCTG AAGATTGGAA AGGCCAAGCT ATTGCAGAAC AAGCTATTAA TTTTGATGAA 
GAAGTTTCCT TAGTCGGTGT TCGAGGCAAA AATGGTGAGA CACACTTTTA CCCGCTAACA 
TTGAACCTTC ACATTAATGG CATCCTATAC GCATCCATTT CTCCATTAGA GCGCCTAAAG 
CCTTTGCAAA GCAAAGCTGA AGCAATGCTT AGCAAGCTTA TGGAGGCTTT AGACTACGTC 
GGCGTAATGG CGATGGAGTG TTTCCGTGTA GGTGATGAGC TACTCATTAA TGAGCTTGCT 
CCAAGAGTCC ATAACAGCGG CCATTGGACA CAAGCAGGTG CAAGCGTATG TCAATTTGAA 
AACCACGTAC GTGCTGTCAC AGGACTTCCA TTAGCGCCAG CTGAAGTCAA GAATCAAAGC 
ATGATGGTCA ATTTAATTGG TGTCGATCTA AACTATGACT GGCTAAACGT ACAAGGCTTA 
GAACTTTATT GGTACAAAAA GGAAGTTCGC CCTGGAAGAA AAGTTGGCCA TCTGAATTTT 
TGTTCTGGTA GCTACTCAGT ATTAGAGTCA GCATTAACAA AACTAGATCT TCCACAACCT 
TATCCGGAAG CTTTAGAGTG GTTAGCTAAA AACTTACCCA AGTTATAA

Protein sequence

MSVLWVLGAG QLGAMLKQAG TPLGIDVRPV DIESTETLAL APTDIVTAER EEWPETIATK 
QLATHSNFVN LATFPQLADR LTQKQWLDRL ELATAPWFPV EIDSSATHSY ETLGERVLMK 
RRRGGYDGKG QYWLKQSEGI EIPEDWKGQA IAEQAINFDE EVSLVGVRGK NGETHFYPLT 
LNLHINGILY ASISPLERLK PLQSKAEAML SKLMEALDYV GVMAMECFRV GDELLINELA 
PRVHNSGHWT QAGASVCQFE NHVRAVTGLP LAPAEVKNQS MMVNLIGVDL NYDWLNVQGL 
ELYWYKKEVR PGRKVGHLNF CSGSYSVLES ALTKLDLPQP YPEALEWLAK NLPKL