Gene NATL1_01671 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_01671
Symbol
ID	4780822
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	160198
End bp	161778
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	33%
IMG OID	640083431
Product	RND family outer membrane efflux protein
Protein accession	YP_001013996
Protein GI	124024880
COG category	[M] Cell wall/membrane/envelope biogenesis [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1538] Outer membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGAGAG TGAAGAGAAA GTTTCTAATT GTTGCAGGTT TATTTATATC TGGGCTAAAT 
CCTTTGTGGG CTACAAGTTC GCAAAAAATA ATTTCCGATA TAAAGATAAA AGGAAACTCA 
AGTAAAAGCC TAAGTCAAAA TCAAAAACAA CAGCGGATCT TATATGAATT AAATGCCCCT 
GAAGATCTTT TTTTACCCTC TAGATCACGC GAAGTATTAG TAAAAACTTA TCAAAAAGTT 
AACCTTGATC AGTTAGAAAA TTTACTTATA AATAACAACC GAACAATTAA AATCTACTTA 
GAAAGAGTTG AGCAAGCCAA ATCAATATTA AAAAGTTCTT TATCCTCATG GTACCCAACA 
TTAAACCTAA CAGCTAATGG CATTCCCCAA TATTTTGAAT CTAATAACTA TAATGAATCA 
AGCGTAATAC AAGATACTTC GAGTAAACAA TGGAGTTCCT CTATCTCCGC TCAATTAAAA 
TGGGATTTAA TTAATCCTGC AAGAGTCCCA GAGATAGCAT CAGCTAGAGA TAGTTTTGAA 
AAGTCAAAAT ATTCTTACGC AATAATTTTA AGAGATTTAA AATTAGAGGC AAAAAAACGT 
TACTTCAATT TGCAAAAAGC CAATGAGGAA ATAGAAGTAG CAAAGAAATC AATTGAATCC 
TCGACTATTG GGTTAAGAGA CGCAGAAATT AGATTTGAAT CAGGTATTGG TACGAAATTA 
GAAGTTCTAG AAGCTAAAAC TCAATTAGCT AGAGATCAGC AATTGTTTAA TATTAAATCT 
GGTGATCAGA AAATTGGTCA AAGATCTCTT GCTGAAATAC TTAATTTCCC AGAGGATGTT 
ACACCATTAA TTGGTTCAAA AACTCAAGTT ACAGGTATAT GGGATTTATC ATTAGAGGAT 
AGTATTATAG CTGCTTATAA TTCAAGAGAA GAACTCGAAA GTATCCTACT AGACATATCA 
ATTAATAATA GTAATGCAAA TGCTGCACTT GCTGCTAGCC AACCAAAATT AAGCATCGTA 
AATACATCGA CCTCTTCATT TGCGAAAGGT GAGTTAAATC AAATATCTCC AAATACCAGC 
AACACATCCT CCAATTTTTC TAACACCATT GGGCTCAATG CAACATGGTT TATTTTTGAT 
GGAGGTAATT CAAGATCTTT GTATAATTAC AATAAAAGTA AAGCAAAAGA AGCAAAACTA 
AATTTTGCCG CAAGAAGAGC CCAAATCAGA CAGGAAGTTG AACAAGTATT CTTCAAACTA 
GACTCGGCTA AACTAAATAT TTCTGCTTCG TATACAGAAG TTTTGTCTGC AAGAGAGTCT 
TTAAGACTTG CAAAACTTAG ATACAAATCA GGTATTACTT CACAACGAGA AGTGGTAAAC 
AACCAAAGAG ATTTAACTGA TTCCGAGGTT CGTTATATTA TTTCCGTCAC TAGCTATAAC 
ACTCTATTAG CTGACTTAAG TAGACAAACG GGTTTAGATA ACATCAAACC ATGTGATATC 
AAAGTCAATC AACAAAATCA AAGTGACATA GATAGCAAAT CACTCTATGA AACAAATTTA 
ATTCCTCTAT GTCAGCTATA G

Protein sequence

MRRVKRKFLI VAGLFISGLN PLWATSSQKI ISDIKIKGNS SKSLSQNQKQ QRILYELNAP 
EDLFLPSRSR EVLVKTYQKV NLDQLENLLI NNNRTIKIYL ERVEQAKSIL KSSLSSWYPT 
LNLTANGIPQ YFESNNYNES SVIQDTSSKQ WSSSISAQLK WDLINPARVP EIASARDSFE 
KSKYSYAIIL RDLKLEAKKR YFNLQKANEE IEVAKKSIES STIGLRDAEI RFESGIGTKL 
EVLEAKTQLA RDQQLFNIKS GDQKIGQRSL AEILNFPEDV TPLIGSKTQV TGIWDLSLED 
SIIAAYNSRE ELESILLDIS INNSNANAAL AASQPKLSIV NTSTSSFAKG ELNQISPNTS 
NTSSNFSNTI GLNATWFIFD GGNSRSLYNY NKSKAKEAKL NFAARRAQIR QEVEQVFFKL 
DSAKLNISAS YTEVLSARES LRLAKLRYKS GITSQREVVN NQRDLTDSEV RYIISVTSYN 
TLLADLSRQT GLDNIKPCDI KVNQQNQSDI DSKSLYETNL IPLCQL