Gene NATL1_01571 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_01571
Symbol
ID	4780513
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	152293
End bp	154011
Gene Length	1719 bp
Protein Length	572 aa
Translation table	11
GC content	32%
IMG OID	640083421
Product	ABC transporter, ATP binding component
Protein accession	YP_001013986
Protein GI	124024870
COG category	[R] General function prediction only
COG ID	[COG0488] ATPase components of ABC transporters with duplicated ATPase domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTGCGAC TAGAGAAGAT TAGTAAAATT TATCCCACTG GCGAAGTCTT GAAAGATGTC 
AGTTGGGAAA TTAGAAATGG AGAGAGAATT GGTTTGGTTG GAGTCAATGG AGCAGGAAAA 
TCAACACAAT TAAAAATTAT TGCTGGATTA GAAGAAGCAA CTGATGGATC TTTGATTAGC 
GAAGGGGATC CATCTATTGC ATATTTAAAA CAGGAATTTG ATGTTGATCT TTCAAGAACT 
GTTAGAGAAG AGTTATTTGC TGCATTTAAA GAAGCATCTG ATTTACTTCA CAGTCAAAAA 
TTAGTTCAAG AAAAAATGGA ATCTGAATTA GCTTCTAAAG ATTTAGATTA CCTAGATTTA 
TTAATCAAAG AATTAAGCGT GATTCAAAGC AAATTTGAAT CAATAAATGG TTACGATTTA 
GAATCTAAAG TTGAAAAGTT ATTACCCACT ATTGGTTTCA ATCAAAATGA AGCAGACAGA 
CTAGTTGGAG ACTTCTCGGG TGGCTGGCAG ATGAGAATAG CTTTAGGAAA AATCCTATTA 
CAAAGTCCTG ATTTATTGTT ACTTGATGAA CCAACTAATC ATTTAGATTT AGAAACGATT 
GAATGGCTAG AGAATTATTT ACTTAATCAG AAAATTGCTA TGGTAATTGT TAGCCATGAT 
AGATCTTTCT TAGATAAAAT TTGTACGAGA ATTGTTAATA CCGAGCGAGG TAAATCTAAA 
AGCTATCTTG GAAATTATAC GTCATATCTT CAACAGAGAG ATTTTGAATT GGAATCAACA 
AAAGTTGCAT ACGAGAAACA ACAGAAGGAT ATACAAGTTC AAAAGGCATA TATAGAAAGA 
TTTCGAGCAA GTGCTACAAG AAGTACACAA GCTAAAAGTA GAGAAAAGTT ATTAGATAAA 
GTTGAAAAGA TAGAAGCTCC TGAGAATAAC TTAAAAGGAC CTAATTTTAA ATTTTTGGAA 
GCACCACGTG CTGGTAGGGA TATCTTAAAT ATTAAGGATT TAACCCATAG CTATGAAGAT 
AATATTTTAT TTTTAGGAGC CTTTTTAGAG CTTGAGCCAG GCGAAAGAAT AGCATTTTTA 
GGTCCAAATG GTTCTGGGAA ATCTACTTTA TTGCGACTAA TTATGGGGTT AGAAGAACCT 
GATGAAGGAT CTATTACGAT AGGAAAATAT AATATTATAC CTAGTTATTT TGAACAAAAT 
CAAGCAGAGG CCTTAGAGTT AGAAAAAACA GTAATTGAGA CAATTTCTCA ATCTGTACCT 
GATTGGACAC AAACAGAAAT TCGTTCTTTA CTGGGTAGCT TTGGTTTAAC TAATGATTCG 
GTTTTTAAGG AGGTCAGTCA GATTAGTGGA GGAGAGAAAG CAAGACTTGC TTTAGCTTTA 
ATGATTATTA AGCCGTCAAA TTTGCTTATT CTTGATGAAC CGACAAATCA TTTAGATATA 
CCTTCAAAGC AAATGCTAGA GCAGGCATTA TCCAATTATA ATGGCACTGC ATTAATAGTT 
TCTCATGATC GATATTTTAT TTCAAAAGTT GCAAACAAAA TTGTAGAAAT AAGAGATGGT 
CAATTAATTA AGTATCAAGG TGATTACAAA TACTATAAAG AGAAAAAAAT CGAAGAATCA 
CAAGAAAAAG AAAAAGAATT ACAATTAGCT GAAAGGGAAA GAAAAAGGTT GGCTAATCGA 
GAAAAACAGC GTAGGAAGAA GAAAACTAAA CAAAAATAA

Protein sequence

MLRLEKISKI YPTGEVLKDV SWEIRNGERI GLVGVNGAGK STQLKIIAGL EEATDGSLIS 
EGDPSIAYLK QEFDVDLSRT VREELFAAFK EASDLLHSQK LVQEKMESEL ASKDLDYLDL 
LIKELSVIQS KFESINGYDL ESKVEKLLPT IGFNQNEADR LVGDFSGGWQ MRIALGKILL 
QSPDLLLLDE PTNHLDLETI EWLENYLLNQ KIAMVIVSHD RSFLDKICTR IVNTERGKSK 
SYLGNYTSYL QQRDFELEST KVAYEKQQKD IQVQKAYIER FRASATRSTQ AKSREKLLDK 
VEKIEAPENN LKGPNFKFLE APRAGRDILN IKDLTHSYED NILFLGAFLE LEPGERIAFL 
GPNGSGKSTL LRLIMGLEEP DEGSITIGKY NIIPSYFEQN QAEALELEKT VIETISQSVP 
DWTQTEIRSL LGSFGLTNDS VFKEVSQISG GEKARLALAL MIIKPSNLLI LDEPTNHLDI 
PSKQMLEQAL SNYNGTALIV SHDRYFISKV ANKIVEIRDG QLIKYQGDYK YYKEKKIEES 
QEKEKELQLA ERERKRLANR EKQRRKKKTK QK