Gene NATL1_06891 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_06891
Symbol
ID	4780976
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	634320
End bp	635705
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	37%
IMG OID	640083965
Product	sodium/solute symporter family protein
Protein accession	YP_001014514
Protein GI	124025398
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0786] Na+/glutamate symporter
TIGRFAM ID	[TIGR00210] sodium--glutamate symport carrier (gltS)

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGCTGT CGTTTTTAGG TTTGGAAGAC CTATACAAAA TGAATGCAAT CCCAACGTTA 
GTCCTTTCCT TGGGTTTGCT TGGACTTATA GGAATTCTTC TAACCCTTGG TAGAAGATTG 
GATTCTGCGA TGAAGTTGGA AAGATTTGGT ATTCCCATAG CCCTTTTAAT TGGAGCTTTA 
GGTTTTTTAA TTGGTCCTTA TGGACCTTTT TCTTTATTAC CAGAAAGGGT TCTGAATACT 
TGGATGCAAT TACCAACTCC ATTGCTTACT TTAGTCTTCG CGACCTTAAT GCTAGGAAGA 
CCTATTCCAA GAATTAGTGC TTTATGGAAA CCAGTTGCTT CGCAGGCATT GCTTGGACTT 
TTATTGGGTT TTGGTCAATA TGTTGTAGGT GGGATAATTG TGCTTTCATT TTTGCTTCCT 
TATTTAGGAG TAGACCCACT GATGGGATGC ATTATTGAGA TTGGTTTTGA AGGAGGACAT 
GGAGCTGCGG CAATAATGGG AGAAAGTTTT ATGAAGTTAG GCTTCCCTGA GGGATTAGAT 
CTGGGCTTTG CAATGGCAAC TGTAGGATTA CTTGCTTCTA CTTTGTTAGG GAGCGGTTTG 
GTTGTCCTAG GTAGGTTTTT TGGATGGCTT GTAACTACTG AACAAGAGCT TCCAAATGAT 
TTAAATGATA TTGAATTTGA AATCAAACCA ATTGAACAAC TTAAGTCGCT TTTATATAAT 
TTTGCTCTAC TAGGATTAGC GGTATTGATT GGAATCTTTT TTCTTTATTG TTTAAGGCTA 
TCTTCTAATT TTATGAGTGA TATAAGTAAG CAGGTGATAT TAGCTTTCCC AGTATTTCCT 
TTGGCTTTGA TGGGTTCATT TTTAGTTAGA TTTTTATTGG AAAAAACTGG AAAGACTAAA 
TTAGTATCAT CACTTTTTCA ACGTGAGATT GGCATACTTT CAACCGATTT ACTCATAATT 
ACCGCGATGG CAGGATTGAA TTTACCTTTA TTAGTTAACT ACTGGGTTCC GATAACCATT 
TTAGCCGTTG GTGGATTGAT TTGGAATCTT GTAGGGATGT TGATTTTTTC TAGATTATTT 
TTTAGAGAAG AATGGTTTGT AAGAGCAATA GCAGAGTTTG GAAATTCAAC AGGAGTTGCA 
GCTAGTGGAC TATTACTTTT GAGATTGGCT GATCCAAGAA ATTCTACTAA TACGTTGCCT 
GTATTTTCTA TTAAGCAATT ATTTCTTCAA CCCCTTCTTT CTGGAGGTCT GATTACTGTA 
ATAGCGCCTT TGTTTATTAG TAATTTTGGG CTTAAAGGGT GGACAGAATT TTGTGGATTA 
GTTTCATTGT CTTTATGTGT AGTGGCAATA TCTCTACAGT CAAAATATAC AAAAGCCTCA 
GCATGA

Protein sequence

MRLSFLGLED LYKMNAIPTL VLSLGLLGLI GILLTLGRRL DSAMKLERFG IPIALLIGAL 
GFLIGPYGPF SLLPERVLNT WMQLPTPLLT LVFATLMLGR PIPRISALWK PVASQALLGL 
LLGFGQYVVG GIIVLSFLLP YLGVDPLMGC IIEIGFEGGH GAAAIMGESF MKLGFPEGLD 
LGFAMATVGL LASTLLGSGL VVLGRFFGWL VTTEQELPND LNDIEFEIKP IEQLKSLLYN 
FALLGLAVLI GIFFLYCLRL SSNFMSDISK QVILAFPVFP LALMGSFLVR FLLEKTGKTK 
LVSSLFQREI GILSTDLLII TAMAGLNLPL LVNYWVPITI LAVGGLIWNL VGMLIFSRLF 
FREEWFVRAI AEFGNSTGVA ASGLLLLRLA DPRNSTNTLP VFSIKQLFLQ PLLSGGLITV 
IAPLFISNFG LKGWTEFCGL VSLSLCVVAI SLQSKYTKAS A