Gene NATL1_01501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_01501
Symbol	trkG
ID	4780314
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	147720
End bp	149105
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	35%
IMG OID	640083414
Product	Trk family sodium transporter
Protein accession	YP_001013979
Protein GI	124024863
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0168] Trk-type K+ transport systems, membrane components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTATTA GGCAAGAAAC TTATAGAAGG CTTACGGTTC CGCAGTTTAC AGTGGTAACA 
GGTTTACTTG TGATTGCTTT TGGAACATTA TTATTGGCTA CACCTTTTTG TTCTAATGCA 
AATGTAGGTC TATGGGAGGC ATTATTTACG GCAACTTCTG CTGTCACAGT TACGGGGTTA 
TCTATTATTG ATATAGGAAT AGATTTGACA TTTTTTGGAC AAGTAATTTT AGCGATTATG 
TTGTTAACTG GGGGCCTTGG TTTAATGGCT ATTACTACAT TTTTGCAGGG CTTTATTGTT 
AGTGGAACAG AATTAAAAAC ACGTCTTGAT AGAGGGAAAA CTCTTGATGA ATTTGGAGTC 
GGGGGTGTGG GTACAACGTT TAAAGGTATT GCGATTACAG CATCTATACT TATTTTTCTT 
GGTTCTATTA CTTTGTATTT TTTCGGCTTT AAAAATATAA CTAGCTCAAG TGAAAGGATT 
TGGGCATCAA TTTTTCATAG TATATCTGCT TACAATAATG CTGGGTTCAG TTTATGGTCA 
AGCAGCTTAC AAAATTATAG AGGTAATTGG GTAGTGAATT TTGTTTTAAT TACTTTAATT 
ATATTAGGTG GTTTTGGATG GAGAGTAACT AATGATATTT GGATAAATCG TAGATCTTTA 
AAATTAAGAA ATTTAAGTCT TCATACACGT TTAGTAATTA GATCATCTTT CATATTGATT 
GCTCTGGGAT TCTTTGGATT GATTTTTACT GAATCGTTAG CTAGGGGTAG CTTCTTTTCG 
TTAATTAATT TCGATGATCG TATTTTAACC GCTTTATTTA CTTCTGTTAG TTCACGAACT 
GCAGGCTTTA CGAATTTGCC CATATCAATT GAAAGTGTCT CTGACTCAGG TCTCTTGTTG 
ATAATGTTTC TTATGTTTAT TGGGGCAAGT CCAGGAGGCA CTGGAGGCGG AATTAAGACG 
ACAACTATTG CTGCATTAAT GGCAGCCACA AGAGCAACTC TACGTGGTCA AAATGAAATT 
ATTATTCGGA ATCGTCAGAT ATCTGACAAA GTAATTCTTA AAGCTGTTGG TATAACTGTT 
GGTTCATTTT TATTTGTGTT GATTATGGCT TTATTATTAA GTTTGAGTAA TGGATTCAAT 
AGTGGAGAGA ATTTTTCATT TTTAGAAATG CTTTTCACTT GTATTTCTGC TTTTGCAACT 
GTAGGTTTTG ATCTGGGCGT AACCTCTAAG TTAGGACATG TCGGTCAATT AATTCTGATT 
ATTGGAATGT TTGTTGGCAG ACTAGGAATC CTTTTATTCT TGAGCGCTGT ATGGCAAGCT 
CTTAATAAAA GTAAGATTCA ACATCGCAAT CGAATTGGCT ATCCGAAGGA GGATCTCTAT 
GTTTAA

Protein sequence

MSIRQETYRR LTVPQFTVVT GLLVIAFGTL LLATPFCSNA NVGLWEALFT ATSAVTVTGL 
SIIDIGIDLT FFGQVILAIM LLTGGLGLMA ITTFLQGFIV SGTELKTRLD RGKTLDEFGV 
GGVGTTFKGI AITASILIFL GSITLYFFGF KNITSSSERI WASIFHSISA YNNAGFSLWS 
SSLQNYRGNW VVNFVLITLI ILGGFGWRVT NDIWINRRSL KLRNLSLHTR LVIRSSFILI 
ALGFFGLIFT ESLARGSFFS LINFDDRILT ALFTSVSSRT AGFTNLPISI ESVSDSGLLL 
IMFLMFIGAS PGGTGGGIKT TTIAALMAAT RATLRGQNEI IIRNRQISDK VILKAVGITV 
GSFLFVLIMA LLLSLSNGFN SGENFSFLEM LFTCISAFAT VGFDLGVTSK LGHVGQLILI 
IGMFVGRLGI LLFLSAVWQA LNKSKIQHRN RIGYPKEDLY V