Gene A9601_19051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_19051
Symbol
ID	4718644
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	1641064
End bp	1642335
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	31%
IMG OID	640079640
Product	major facilitator superfamily multidrug-efflux transporter
Protein accession	YP_001010295
Protein GI	123969437
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAGAAA GTTTATTAAA ACCAAATAAA AAATTTACTC TCCTTAGTGC CTTTATCACT 
CTTCTAAATG ATCGTTTAAG TGAAAGCATA TTACTACCTA TATTACCCTC CTTTGTTTTA 
CTTTTTGATT CTAAAGCAAG TACATATGGT TTATTATCAT GCACTTACCA ATTAGCTCAA 
TTTACAGCTT CTCCTTTTAT AGGACTTATG AGCGATAGAT ATGGAAGAAG ACCTGTCACT 
CTTTTTTGTA TTACTGGTTC AGTCATAGGA ATATCAATAT TATCTTTTAC GGTTCTATTT 
AACTGGTCAA ATTCAATAGC CTCTATCCCT TTATTTTTAT TATTTTTAGC AAGACTAATT 
GACGGTTTAA GTGGGGGAAC TGCAGCTACT GCAACAACAA TTCTTGCAGA TATTTCAAGC 
CCTGAAAAAA GAGCAAAAAC ATTTGGACTT ATTGGTGTAG CTTTTGGTTT AAGTTTTTTC 
TTAGGTAATA TTTTTGTTGT TATTTTTGCC AAAAATACAA ATAATAATTT TATTATTCCA 
GTTTTGATAG CCTCAATCAT TCCAATAATA AATTTCCTCC TTGTATTTTT TTACTTACCG 
GAAACCAAGC CTAATAGTGA CTCAAATAAA TCAAAACCTT TTATAAGAAA CCCTTTAAAA 
AACCTATTTA CAGTTTTCAA AGAAGAAAAG ATTAAAAAAT TATCATTAGC TTTTTTTATT 
TACTTTATTG CCTTTACTGG ATTGACCAAT ATACTTATAT TCTTCCTTCA AGAATCTTTA 
AACTGGACGA CAAAAGCATC AAGTGGAACT CTTGTTGTAG TAGGAATAAT TGCAATTATC 
GTTCAGGGAG GACTAATTGG GCCTCTTGTA AAACAATTTG GAGAAATGCG ATTAACACTT 
ATCGGATCAG GCTTCATTCT TGTTGCATGT GCTCTTTTAA TAACTGCTCC AAAAGAAAAT 
GCGACAATTA ATATTTATTC AGCTGTATCA TTTTTAGCCG TTGGGGCAGG ATTAATTACG 
CCCACCTTAA GAGCACTAAT ATCAAAGAAA TTAGACATTG ATAAACAAGG ATCAATTTTA 
AGTAATCTTC AAGGTCTACA GAGTCTTGGG GGGGTTTTAG GAATTGCAAT GGCAGGAAGG 
GTTTATGATA GTTTTGGTCC TAAATCTCCT TTTATAGCTG GTTCCGTTAT CTTGCTTTTC 
ATGATATATC TTATTGCAGA GGGTAAAAGT AATAATTCTT TTAATAATCA AAAATCAAAA 
GTATTGAAAT GA

Protein sequence

MKESLLKPNK KFTLLSAFIT LLNDRLSESI LLPILPSFVL LFDSKASTYG LLSCTYQLAQ 
FTASPFIGLM SDRYGRRPVT LFCITGSVIG ISILSFTVLF NWSNSIASIP LFLLFLARLI 
DGLSGGTAAT ATTILADISS PEKRAKTFGL IGVAFGLSFF LGNIFVVIFA KNTNNNFIIP 
VLIASIIPII NFLLVFFYLP ETKPNSDSNK SKPFIRNPLK NLFTVFKEEK IKKLSLAFFI 
YFIAFTGLTN ILIFFLQESL NWTTKASSGT LVVVGIIAII VQGGLIGPLV KQFGEMRLTL 
IGSGFILVAC ALLITAPKEN ATINIYSAVS FLAVGAGLIT PTLRALISKK LDIDKQGSIL 
SNLQGLQSLG GVLGIAMAGR VYDSFGPKSP FIAGSVILLF MIYLIAEGKS NNSFNNQKSK 
VLK