Gene NATL1_11591 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_11591
Symbol
ID	4780546
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	1035570
End bp	1036598
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	31%
IMG OID	640084438
Product	arsenite efflux pump ACR3 and related permeases
Protein accession	YP_001014982
Protein GI	124025866
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0798] Arsenite efflux pump ACR3 and related permeases
TIGRFAM ID	[TIGR00832] arsenical-resistance protein

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0590544
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTTTG TAGATCGATA CTTAAGTTAT TTTATCGCTG TTTCTATGAT TCTAGGGGTT 
TCTATTGGAT CTATCTTTCC TAATGTTTCC AATTATATTT CCTCTTTAGA ACTAACAGGT 
ATCAATCTAC CTATAGCTTT TTTGATATGG GGAATGATTA TTCCGATGAT GTTATCAATA 
AATTTTAATT CTATTATCAA AATCAAGGAT AGGCCACAGG CAATTTTAAT TACAGTAATA 
GTGAATTGGT TAATCAAACC AATACTTATG ACAGGTATAG CTATATTATT TATAAATAAT 
ATATTTTCTA CTTGGATTGA TACTGGTAAA GCATCAGAAT ATATTTCTGG AATGATTCTA 
TTAGGAGTTG CTCCCTGCAC TGCAATGGTT TTTGTTTGGA GTAATCTTGT TAAAGGGAAC 
TCTAACTATA CTTTGGTCCA GGTTATTATT AATGATCTTA TTTTATTATT TGCTTTTGCA 
CCTATTGCTT CTTTCTTGCT TGGTGTTAAT CAAATCAAAA TACCCTTATG GACTATATTT 
AACTCTGTTT TGATTTATGT ATTTATACCA CTTTTATTCT GCTTATTAAT GAAAAAAATT 
GTTAATAATG CAGCAAAGAT TCATATGATA AACAATTTTT TGAAGCCCGT TTCTGGGATT 
TGCTTGGTTT TAACTGTTTT ATTTTTATTT TTAGTACAAG CTAGTGAGGT TATCAATAAC 
CCATTCCAAA TCTTATTAAT AGCTATACCT TTAATTATTC AGACCTTTTT GATCTTTTTT 
ATTGCAGCAA TTCTTATGAG AATATTTAAT CAAGAAAAAT CAATAGCAGG TCCAGCGTCA 
ATGATTGGGG CTTCCAATTT CTTTGAATTA GCTGTTGCTA TCGCAATAAG CCTTTTTGGT 
GTTAATTCAG GTGCCGCAAC TGCGACGGTT GTTGGTGTTT TAGTTGAAGT GCCAGTAATG 
CTATCTTTGG TTGGCATTGT TAACAATAAT GATTATTTAT TTCCTACTCG AGCTAAAAGC 
TTTAACTGA

Protein sequence

MSFVDRYLSY FIAVSMILGV SIGSIFPNVS NYISSLELTG INLPIAFLIW GMIIPMMLSI 
NFNSIIKIKD RPQAILITVI VNWLIKPILM TGIAILFINN IFSTWIDTGK ASEYISGMIL 
LGVAPCTAMV FVWSNLVKGN SNYTLVQVII NDLILLFAFA PIASFLLGVN QIKIPLWTIF 
NSVLIYVFIP LLFCLLMKKI VNNAAKIHMI NNFLKPVSGI CLVLTVLFLF LVQASEVINN 
PFQILLIAIP LIIQTFLIFF IAAILMRIFN QEKSIAGPAS MIGASNFFEL AVAIAISLFG 
VNSGAATATV VGVLVEVPVM LSLVGIVNNN DYLFPTRAKS FN