Gene NATL1_14611 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_14611
Symbol
ID	4779191
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	1170103
End bp	1171647
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	39%
IMG OID	640084742
Product	putative sulfate transporter
Protein accession	YP_001015284
Protein GI	124026168
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0659] Sulfate permease and related transporters (MFS superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.324968
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAATTGA AAAATTTATT GGTAAAGGAG AGAATTATCT CTCCTTCCCG CGATGTTATT 
GCTGGTCTTG TGGTTGCATT TGCAATGATC CCAGAGGCGA TAGCTTTTTC TGGTATTGCA 
GGCGTTGACC CAAGAGTTGG GTTGTTTGGT GCTTTTTTGC TTTCTGTCAC CCTTGCAATT 
TTTGGGGGCA GAATGGCCAT GATTACCTCA GTAACTGGTT CAACTGCTCT TTTGATGACT 
GGGATTGTTC AACAGGGAGA AAATATTAGC CCTGGCCTTG GTCTGCAATA TCTTTTGGCT 
GCTGGATTGC TTACGGGAGT TCTTCAGATC GCTTGGGGGT ATTTAAGACT TGCTCATCAG 
ATGAGATTTG TACCTCAACC AGTCATGGAT GGCTTTGTAA ATGGTTTAGC AATATTGATC 
TTCCTTGCTC AATTGCCTCA TTTGGGGATT GACATAGCTC ATTCTGAGAA AGTTGTTACT 
GCGGTCCAGC TACCTGCTGT TTGGGGCTTG ACCATACTTA CGTTGTTAAT TATCTATTTG 
CTACCTAAAT TTACCAAGCT TTTGCCATCA GCATTGGTCG CGATTTTTAT TTGTACAGCG 
ATTTCAATTG TATTTAAATT AAATGTTCCA ACTGTATCGA ATTTAGGAAT TCTCCCAAAT 
GGATTACCTA GCTTTGGTAT TCCAAAAGTT CCATTTAATT TCGAAACACT TGGTTTGATA 
CTTCCAACAG CACTAGCAAT TTCTTTGGTT GGTCTTATGG AGACATTTCT CACTCAAGAT 
ATTCTTGATG ATATGACTGA TAAAAGTACA AATAAAAATG TTGAGGCTCG AGGGCAAGGT 
ATGGGAAATA TTGTTAGTTC GCTTTTTGGA GGTATGGCTG GATGCGCTTT GGTTGGACAA 
TCGGTTATGA ATGTGGGTTA TGGGGGAAGA ACTCGTCTTT CAACATTAAG CTCTGGTGTT 
TGTTTAATAG CAATGATTCT TGCGGCTAAG GATTGGGTAA ATCAAATACC AATGGCAACA 
TTGGTTGGAG TTATGATAAT GATTGCTATA AATACTGCTA ATTGGGGCTC AATTAAAGAT 
ATTCGCCGAA TTCCTCGAAG CGATAGCTCA GTTATGATTT TGACTGTATT CGTAACTGTT 
ATTACACATA ATTTAGCTCT TGGTCTTCTT TCTGGTGTTG GACTTGCAGC AATATTATTT 
AGTAGAAAGG TCGCAAAAGT TATTAAGGTT GAGTCTTCTT TGAATGGGAA AGACCACAGG 
ATTTATAAAG TTTCAGGCCA ATTATTTTTT GTTAGTAGCA TTTACTTTAG ACAAGGGTTT 
GAACTACATG AACATCCTAA AAAAATTACA ATAGATATGG CCGAAGCTCA TATTTGGGAT 
CAAAGCGGCG TAACGGTTCT AGACCAAGTA ATCAGAAGAA TAAAAATAGG GGGGTCTGAG 
GTTGAAGTGA TTAATTTAAA TGATGAAAGC TTGAATTTAT TTTCTCGAAT AGGACAAGCA 
TCAGAAGCTG GGGGAAGAGG TGGTGAGTTT AAATCGGCAC ATTAA

Protein sequence

MKLKNLLVKE RIISPSRDVI AGLVVAFAMI PEAIAFSGIA GVDPRVGLFG AFLLSVTLAI 
FGGRMAMITS VTGSTALLMT GIVQQGENIS PGLGLQYLLA AGLLTGVLQI AWGYLRLAHQ 
MRFVPQPVMD GFVNGLAILI FLAQLPHLGI DIAHSEKVVT AVQLPAVWGL TILTLLIIYL 
LPKFTKLLPS ALVAIFICTA ISIVFKLNVP TVSNLGILPN GLPSFGIPKV PFNFETLGLI 
LPTALAISLV GLMETFLTQD ILDDMTDKST NKNVEARGQG MGNIVSSLFG GMAGCALVGQ 
SVMNVGYGGR TRLSTLSSGV CLIAMILAAK DWVNQIPMAT LVGVMIMIAI NTANWGSIKD 
IRRIPRSDSS VMILTVFVTV ITHNLALGLL SGVGLAAILF SRKVAKVIKV ESSLNGKDHR 
IYKVSGQLFF VSSIYFRQGF ELHEHPKKIT IDMAEAHIWD QSGVTVLDQV IRRIKIGGSE 
VEVINLNDES LNLFSRIGQA SEAGGRGGEF KSAH