Gene NATL1_02681 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_02681
Symbol
ID	4779472
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	247047
End bp	248651
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	34%
IMG OID	640083533
Product	ABC transporter ATP-binding protein
Protein accession	YP_001014097
Protein GI	124024981
COG category	[R] General function prediction only
COG ID	[COG1123] ATPase components of various ABC-type transport systems, contain duplicated ATPase
TIGRFAM ID	[TIGR02323] phosphonate C-P lyase system protein PhnK

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAATT GCTCAAAAGA AGTTTTAAAG ATAAATAAAC TTAATGCTAT TTATCCAAAT 
AGTACTACTT ACGTAATAAA TGGATTAAAT CTGAAGATGA ATCGTGGGGA TAGGCTTGCA 
TTGGTTGGTA GTTCAGGTTG TGGCAAAAGT ACTGTTGCTA AGGCCATAAT GCAGCTTCTT 
CCAGACGGAA GTACTTGTTA TGGTGAGATT TTTTTAAATG GAAAAAATGT ATTAAAATTA 
GACGAGGATT CTTTGCCAAC TATTCGAGGA AAAGAGGTTG GATTGATATT TCAGGATCCA 
ATGTCACGGT TGAATCCATT AATGACTGTT GGTGATCATA TAGTTGATAC TTTTAAAGCT 
CATGATAATT CTGAACCAAT TTATAACTTA GTAAAAAAAG CTAAAAGCTT ATTAGAAAAA 
GTTGGAATAG ATCCTTTAAG GTTTAATTCT TTTCCACATG AATTTAGTGG CGGAATGCGA 
CAACGCGTAG CTATTGCTTT GGCAATTTGT TTAAGACCTC CTTTGATAAT TGCTGATGAA 
CCTACTACTA GCTTAGATAC AATAGTTGCT GATCAAATTA TGAGTGAATT GAGTTTACTT 
TGTGATGAGA TTGGGACTGC TTTACTATTA ATTAGTCATG ATTTATCTAT GGCATATAAA 
TGGTGTAATA AAATTGCGAT ACTTGATTGT GGGAAAATAG TAGAATCTGG AAATATTAAA 
CAGATAATTG GTGATCCTAA AACTAATATT GCTCAAAAAT TAGTGGAGTC AGGAAGGTTA 
TTAGAGGGTT CTGAGAGAAA GTTAATTAAT AAAAGTACTG TACTATTGAG CGTAAATAGA 
TTACGTTGCT GGCATGATTT AGGCTTCTGG CCCTTCAATT CTTTTTGGTT GAAAGCTGTT 
AATGAAGTTA CCTTTTCTCT GTATGAAGGT GAAACTCTTG GTATCGTAGG CCCATCAGGA 
TGTGGAAAGA GTACTCTCTG TAGAGCGTTG ACTGGTTTAT TACCTACAAG AGGTGGAAGT 
GTTCTTTTTC TTGGAAAGAA TATTTCAATT ATCAATAGGA AATCTTTAAA ACAATTACGT 
AAATATATTC AAATTATTTT TCAAGATCCT TCTGCTTCTT TGAACCCTAA GATGTCAGTA 
CTGGATGCAA TTATAGATCC AATTCTTATT CATAAATTGT TAAGTCGATC TCAAGCCAGA 
GAAAAAGCTC GTAATCTTTT AGACCTAGTT GGTTTAGTGC CCACAGCAAT GTATGAACAA 
CGCTTACCTT CTCAACTTTC AGGAGGACAA CAGCAAAGAG TAGCTATTGC AAGAGCACTT 
GCACTTAGTC CCAAAATACT TATCTGTGAT GAAAGTGTCA GTATGTTAGA TGCAGAAATT 
CAAGCAGAAG TCTTAGAGTT GCTACGCTCT TTGCAAGAAA AATTGAAACT GTCTATGTTG 
TTCATAACTC ATGATTTATC TGTTGCAGCA GGCTTTTGTC ACAGAGTATT AGTGTTAGAT 
AAAGGGAAAA TTATCGAAGA AAATTTTGGT AAAAATTTGT TAAATGATCC TCAAAAATAC 
TTAACAAAAA AGATGGTTAA GGCATGTCCT AGACTTCCGA ATTAA

Protein sequence

MNNCSKEVLK INKLNAIYPN STTYVINGLN LKMNRGDRLA LVGSSGCGKS TVAKAIMQLL 
PDGSTCYGEI FLNGKNVLKL DEDSLPTIRG KEVGLIFQDP MSRLNPLMTV GDHIVDTFKA 
HDNSEPIYNL VKKAKSLLEK VGIDPLRFNS FPHEFSGGMR QRVAIALAIC LRPPLIIADE 
PTTSLDTIVA DQIMSELSLL CDEIGTALLL ISHDLSMAYK WCNKIAILDC GKIVESGNIK 
QIIGDPKTNI AQKLVESGRL LEGSERKLIN KSTVLLSVNR LRCWHDLGFW PFNSFWLKAV 
NEVTFSLYEG ETLGIVGPSG CGKSTLCRAL TGLLPTRGGS VLFLGKNISI INRKSLKQLR 
KYIQIIFQDP SASLNPKMSV LDAIIDPILI HKLLSRSQAR EKARNLLDLV GLVPTAMYEQ 
RLPSQLSGGQ QQRVAIARAL ALSPKILICD ESVSMLDAEI QAEVLELLRS LQEKLKLSML 
FITHDLSVAA GFCHRVLVLD KGKIIEENFG KNLLNDPQKY LTKKMVKACP RLPN