Gene NATL1_15381 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_15381
Symbol	ddpA
ID	4780496
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	1251281
End bp	1252858
Gene Length	1578 bp
Protein Length	525 aa
Translation table	11
GC content	31%
IMG OID	640084820
Product	ABC transporter substrate-binding protein
Protein accession	YP_001015360
Protein GI	124026244
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.318492
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATAAAAC TAAATTGTAT AAAAAATATT TTAAAAGTAT CAAGTATTCT CCTAATACTC 
ATACAGTTAT CTTGCTCCCA ATATAAGAAA AGAGAAAATA TTATTGTTGC AAGTGCAGGT 
AAAATTGAAT CACTTGACCC TGCTCAAGCA AATACACTCA GGACATTACA AATATTAAGC 
GCTCTTGGAG ATACTCTATA CAAAATAAAT AAGGAAGGGA ATCTATCACC AAGCTTAGCT 
AAAGATTTAC CAAAAGTAAG TAAGAATGGT TTGCTAATAG ATATTCCACT CAAAGAAAAT 
ATTTCTTTTC ACGATGGAAG TATTTTCAAT GCAGAAGCGA TGGCGTTTAG TCTTAATCGA 
TTCAGAAAAA TTGGAACTTT AAATTACCTA TTAAATGACA AAATAGAGGA TATTGAAGTC 
AAAGGAAAAT TTCTTTTAAG AATAAAATTA AAAAAACCAT CGAGTTCATT AGCAAGTCTT 
TTAACATCAG TAAATTTGAC ACCTGTCTCT CCTGATTCAT ATTCAAACTA TAAAGATAGT 
TTCAATAATA AAAAGTTTGT AGGGACAGGA CCTTATTTCT TAGAAAGTTT CAACTCAAGT 
CAACAAATAA TAAAGCCATT CAAAAATTAT TGGGGAGAAA AACCCCTAAA TAAAGGTATT 
AACTTTATAA ATTATAGTAA TTCTAGTACT CTTTTTGGAG CTATAAAAAC AAAGGAAGTT 
GACGTCCTCA TCTCAAATTC TATAGATGAT TTGCAGCGAT TAACATTAAA TAATATGGCT 
AAGAAAGATC AACTAAAATC CGGAGAGGGT GATCCAATAG AGATAGGATA CATTACATTT 
AAAAGCAATA AATTACCTTT AGAAAATAAA GTAGTTAGGA AGGCTCTTTC CTACACTATT 
GATAGAGAAT TAATTAGTCA ACAAGTAAGT TTCGGAACAA GAGAACCATT AAGATCAATT 
GTGCCTCCTC AACTACATAA AAAAGAATTT AAGCCATGGC CTAAATATAA TCCTAATACT 
GCAAGATCTT TATTAAAAAC AGAAGGCTAC TGTGTAACAG AGATTCTTTC TATTCCATTA 
ACATTTAGAT CTAATGTACC TGCAGATAAA TTACTTGCCC TTACTTGGAG AGATCAAATC 
AAAAGAGATT TATCTGATTG TTTAGAAATA ACTTTAAATG GAATTGAGTC AACCACAGTC 
TACAAACAAC TTTCCGAAGG GGCTTTTGAA GCGGTTATAT TAGATTGGAC TGGGGCATAT 
CCTGACCCAG AAGCATATTT AACTCCCTTA CTAAGTTGTA ATGAACTAAA TAATAATTCT 
TGCCTCAAGG GTGAAGCTGT ATTCAGTGGT AGTTTTTGGG GTGATAAAAA ATTACAAGAA 
CTCTTGGAGA AAAGTGAAGA ACTAGATGGA GAAAACAGAC TAAATAATTT AATAAAAGTT 
GAAAAACTTG CAGCACAAGG AGGTGCCTAC TTACCAATTT GGCTCGTTAA TCCTAAAGCT 
TGGTCTCTAA AAGATATAAG CCAACCAGAA TTTTCAAAAG ATGGATTAAT TATCCTGAAA 
AACTTAGAGA GAGACTAG

Protein sequence

MIKLNCIKNI LKVSSILLIL IQLSCSQYKK RENIIVASAG KIESLDPAQA NTLRTLQILS 
ALGDTLYKIN KEGNLSPSLA KDLPKVSKNG LLIDIPLKEN ISFHDGSIFN AEAMAFSLNR 
FRKIGTLNYL LNDKIEDIEV KGKFLLRIKL KKPSSSLASL LTSVNLTPVS PDSYSNYKDS 
FNNKKFVGTG PYFLESFNSS QQIIKPFKNY WGEKPLNKGI NFINYSNSST LFGAIKTKEV 
DVLISNSIDD LQRLTLNNMA KKDQLKSGEG DPIEIGYITF KSNKLPLENK VVRKALSYTI 
DRELISQQVS FGTREPLRSI VPPQLHKKEF KPWPKYNPNT ARSLLKTEGY CVTEILSIPL 
TFRSNVPADK LLALTWRDQI KRDLSDCLEI TLNGIESTTV YKQLSEGAFE AVILDWTGAY 
PDPEAYLTPL LSCNELNNNS CLKGEAVFSG SFWGDKKLQE LLEKSEELDG ENRLNNLIKV 
EKLAAQGGAY LPIWLVNPKA WSLKDISQPE FSKDGLIILK NLERD