Gene NATL1_17501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_17501
Symbol	melB
ID	4780241
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	1432044
End bp	1433447
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	37%
IMG OID	640085038
Product	GPH family sugar transporter
Protein accession	YP_001015570
Protein GI	124026455
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2211] Na+/melibiose symporter and related transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.276796
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAATAATT CCACATCGAT TTACGAAGGA AATAATCGCA CAAGACTAAT GATCTCTTAT 
GCAATGGGAG ATGCTGGAAC GGGATTAGCC GCAATACAGC TAGGTACTTA TCTATTTCTT 
TTTTTTACTT GTGCTGCAGG AATTCCTGCA TTTATTGCAG GCTCGCTTCT CATGGTTTCA 
AAACTTTGGG ATGCGATAAA TGATCCTCTA ATTGGATGGA TGAGTGATCG CACCAGATCA 
AGATGGGGGC CAAGGCTTCC ATGGATGATT GGAGGTGCTG TTCCACTTGG TTTATTCCTT 
GCCGCAATGT GGTGGGTCCC TCCTGGAGAT ATAGATGCGA AAACAACTTA TTACGTATTC 
GCAGCAATTT TTTTGATGAC AGCTTATACA GCAGTAAATC TACCTTTTGC AGCATTATCT 
ACTGAGCTAA CTGAAAATAT AGCTATTAGA ACAAGACTTA ATGCTGCAAG ATTTACTGGG 
TCTATTATAG CTGGAACCAC TGGATTAATA GTGGCTGCAG GCTTCTTATC TCAAGGAGTA 
GAAGGTTATA CTTCAATGGG AAGAGTAACA GGAGTTATTG CTACTTTTAC CACATTAATT 
GCTTGCTGGG GACTAGCCCC ATTTGCTAAA AAAGCCAGAA AGCCCACTTC TCAATCAGAA 
CCTTTTAATC AGCAGCTAAA AAGAGTTTTA AATAATAAAC TTTTCACACG AATTATTGCT 
CTTTACTTGC TGCTTTGGTG CGGACTGCAA TTAATGCAAA CCGTTTCATT AATCTATCTT 
GAGCAAGTAA TGCTTGTTCC AATAGAAATT TCAAAATGGA TCCCTATACC ATTTCAAATT 
AGTACTCTAT TAGGTCTACA GTTTTGGAGC TTTTACTCCA ATAAATATGG AAGAATATCA 
GCACTATTCA AAGGTGGGAA AATATGGATA TTAGCCTGTT TTTTAGTTAT ATTTATGCCC 
CCAATAACTA AAGGAGTCAG TATCAATTCT TTATTAGCCT TTGGTGATAT TGAAGGTATA 
AAGCTGTTGA TTCTTTTATT AATAATTATT TTGGTAGGAT TTGGAGCTTC AACAGCATAT 
CTTATTCCTT GGTCCTTACT TCCTGATGCT ATTGATCAAG ATCCCGAAAA GCCTTCAGGA 
ATATATACAG CATGGATGGT TTTTATTCAG AAAATAGGTA TTGGTTTAAG CGTTCAATTT 
CTAGGAGTTC TTTTATCTTT ATCAGGATAT AAATCATCCA CTAATTGCTT ATCAAGTCTT 
GAAGACCTAG ATCAACCTCT AACAGCAATT ATTACTATTA GATTATGCAT GGGATTAATA 
CCTTCTTTGC TAGTAATTGC TGGATTAATA ACTATGAAAC CGTGGCGAAG TTTAGATTTC 
AAATCTAGAA GGTTAAGTCA ATGA

Protein sequence

MNNSTSIYEG NNRTRLMISY AMGDAGTGLA AIQLGTYLFL FFTCAAGIPA FIAGSLLMVS 
KLWDAINDPL IGWMSDRTRS RWGPRLPWMI GGAVPLGLFL AAMWWVPPGD IDAKTTYYVF 
AAIFLMTAYT AVNLPFAALS TELTENIAIR TRLNAARFTG SIIAGTTGLI VAAGFLSQGV 
EGYTSMGRVT GVIATFTTLI ACWGLAPFAK KARKPTSQSE PFNQQLKRVL NNKLFTRIIA 
LYLLLWCGLQ LMQTVSLIYL EQVMLVPIEI SKWIPIPFQI STLLGLQFWS FYSNKYGRIS 
ALFKGGKIWI LACFLVIFMP PITKGVSINS LLAFGDIEGI KLLILLLIII LVGFGASTAY 
LIPWSLLPDA IDQDPEKPSG IYTAWMVFIQ KIGIGLSVQF LGVLLSLSGY KSSTNCLSSL 
EDLDQPLTAI ITIRLCMGLI PSLLVIAGLI TMKPWRSLDF KSRRLSQ