Gene PMN2A_0447 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PMN2A_0447
Symbol
ID	3605821
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL2A
Kingdom	Bacteria
Replicon accession	NC_007335
Strand	+
Start bp	981609
End bp	982637
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	31%
IMG OID	637687307
Product	ACR3 family arsenite transporter
Protein accession	YP_291642
Protein GI	72382287
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0798] Arsenite efflux pump ACR3 and related permeases
TIGRFAM ID	[TIGR00832] arsenical-resistance protein

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.881711
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTTTAA TAGATCGATA CCTAAGTTAT TTTATCGCTG TTTCTATGAT TCTAGGGGTC 
TCTATTGGAT CTATCTTTCC TAATTTTTCT AATTATATTT CCTCTTTAGA ACTAACAGGT 
ATCAATCTAC CTATAGCTTT TTTGATATGG GGAATGATAA TTCCGATGAT GTTATCAATA 
AATTTTAATT CTATTATCAA AATCAAGGAT AGGCCACAGG CGATTTTGAT TACGATAATA 
GTGAATTGGT TAATCAAACC AATACTTATG ACAGGTATAG CTATATTATT TATAAATAAT 
ATATTTTCCT CTTGGATTGA TGCTGCTAAA GCTTCAGAAT ATATTTCTGG GATGATTCTA 
TTAGGAGTTG CTCCTTGCAC TGCAATGGTT TTTGTCTGGA GTAATCTTGT TAAAGGGAAC 
TCTAACTATA CTTTGGTCCA GGTTATTATT AATGATCTTA TTTTATTATT TGCTTTTGCA 
CCTATTGCTT CTTTCTTGCT TGGTGTTAAT CAAATCAAAA TACCCTTATG GACTATATTT 
AACTCTGTTT TAATTTATGT ATTTATACCG CTTTTATTCT GCTTATTGAT CAAAAAAATT 
GTTAATGATG CAGCAAAAAT TTATACGATA AATAATTTTT TGAAGCCAAT TTCTGGGATT 
TGCTTGGTTT TAACTGTTTT ATTTTTATTT TTAGTACAAG CTAGTGAGGT TATCAATAAC 
CCATTCCAAA TCTTATTAAT AGCTATCCCT TTAATCATTC AGACCTTTTT GATCTTTTTT 
ATTACAGCAA TTCTTTTGAG AATATTTAAT CAAGAAAAAT CAATAGCAGG TCCAGCTTCA 
ATGATTGGGG CTTCCAATTT CTTTGAATTA GCTGTTGCTA TCGCAATAAG CCTTTTTGGT 
GTTAATTCAG GTGCCGCAAC TGCGACGGTT GTAGGTGTTT TAGTTGAAGT GCCGGTAATG 
CTATCTTTGG TTGGCATTGT TAACAATAAT GATTATTTAT TTCCTACTCG AGCTAAAAGC 
TTTCGCTGA

Protein sequence

MSLIDRYLSY FIAVSMILGV SIGSIFPNFS NYISSLELTG INLPIAFLIW GMIIPMMLSI 
NFNSIIKIKD RPQAILITII VNWLIKPILM TGIAILFINN IFSSWIDAAK ASEYISGMIL 
LGVAPCTAMV FVWSNLVKGN SNYTLVQVII NDLILLFAFA PIASFLLGVN QIKIPLWTIF 
NSVLIYVFIP LLFCLLIKKI VNDAAKIYTI NNFLKPISGI CLVLTVLFLF LVQASEVINN 
PFQILLIAIP LIIQTFLIFF ITAILLRIFN QEKSIAGPAS MIGASNFFEL AVAIAISLFG 
VNSGAATATV VGVLVEVPVM LSLVGIVNNN DYLFPTRAKS FR