Gene NATL1_18321 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_18321
Symbol
ID	4780730
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	1493487
End bp	1495112
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	33%
IMG OID	640085121
Product	HSP70 family molecular chaperone
Protein accession	YP_001015652
Protein GI	124026537
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0443] Molecular chaperone
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAAAA ATAACATTGA TCAATTCGAA AACATCCTTC GACCTGAAAT CAATAAAAAT 
GTTTTTGGAA CATTAGCCAT CGATTTAGGA AGTTCAACAA CAGTTGTTGT TTTTCAAAAA 
GAAAATGGGC AGCCTCCTGA ACTTTTAGAT CTACCTCCCA TTAGTCGAGC GATTGGAGAG 
ATACCAAGTT TAATTTGGAA GTCATCAGAA AAAGAAGAAT CTTATTTTAT TGGTCAACAA 
ATTATAGATT TAAATCTCAT TAATGAAAAA GAAAATAACT TAAGTCAAGA TTTTAAAAGA 
TGGATAGGAT CTAAGGAAAT TGAACCTATA TATAATTCAA AAATCACCCC AGAAAAAGCA 
GGTGAGATTT TAATTCACAG TATTTGGGAG AAAGTCTCGC AGAAGGTCAA CATCAAAAGA 
CTAGTATTAA CTGCTCCAGT AGATACATAT CGAGAATATA GAACTTGGTT AGTCGATGTA 
TGTAATTCCT TAGAAGTAAA AGAAATTGCT TTAGTTGATG AACCCACTGC TGCTGCAATG 
GGAGCTGGAC TAGAGCCTGG ATCAACATTA CTTGTTTTAG ACTTTGGAGG AAGCACAATT 
GACATGTCAA TTGTTGCTTT AGAGGGAGGA GAAGGACAAG CTTCACCAAT TGCACAGCTT 
GTAAGATTTG ATGGCAATAA TTTAGAGGGA AAAAGTACAC AAGTTCTTCG CACAGCAAAA 
GTTCTAGGTA AATCAGGGCT TCGGTTAGGA GGAAAAGATA TAGATAGATG GATATTTCAT 
CATTTATTAC CAGAAGAAAA TCCAACCAAT TCAATCTTGC GAAAGGCCGA GGAGCTTAAA 
TGTGAATTAA GCAATACTAA TATAAAAGAG ACATTGGTTA TCACTAAAAA AATAAATAAT 
ATTCAGAATG AAGAAAAGTT TTTAAAACTA TCTAAAAAAG GACTTGAAGA ATTACTTATA 
GAAAAAGGAC TCCTAAAAAG TATTGAAAAG CTTTTCAAAC AAACAATTAA TAGCGCAAAA 
CGAAATTCAT TTGAATTAAA AGATCTTGAT AGCGTTGTCT TAGTCGGAGG AGGGTCTCGC 
ATACCTTTAA TTAAAAATTA TTTAAGTGAT ATCTGCAATT CCATCCCTTT TTTGACCCCT 
CCACCTATTG AAGCAATTGC ATTGGGAGCT TTACACCTCA CTCCAGGTGT TCAAATAAAA 
GATGTTCTTA ACAAAGGGGT AAGTTTAAGA TGCTGGAATA AAAAAAATGA AAAGCATATA 
TGGCACCCTC TTTTTCTAGC AGGTCAGACA TGGCCTACAA ATAAGCCTTT AGAAATAATT 
TTAGCTGCAA GTATAAATAG TCAATTAAGC ATAGATTTAA TTATTGGAGA GCCTCAGGAA 
GAAGGGTCAA ATGAGATTAT TTATACTAAT GGATTACCCA CTTTAACAAC AATAGAATCC 
AAGGATAAAA TCAAGAAGAT AACTAATACT ATTATTTCAA TCCCTGTAGA TCCTCCTGGT 
GAAATTGGTC AAGATTGTAT TAAATTAATT TTTAATATTA ATGACAATTG TCAACTTGAG 
GTTGAGGGTG TCGATTTACG TAATAATAAA GAGATAACAA AACAGAATCT TGGAGAGATA 
AGATAA

Protein sequence

MEKNNIDQFE NILRPEINKN VFGTLAIDLG SSTTVVVFQK ENGQPPELLD LPPISRAIGE 
IPSLIWKSSE KEESYFIGQQ IIDLNLINEK ENNLSQDFKR WIGSKEIEPI YNSKITPEKA 
GEILIHSIWE KVSQKVNIKR LVLTAPVDTY REYRTWLVDV CNSLEVKEIA LVDEPTAAAM 
GAGLEPGSTL LVLDFGGSTI DMSIVALEGG EGQASPIAQL VRFDGNNLEG KSTQVLRTAK 
VLGKSGLRLG GKDIDRWIFH HLLPEENPTN SILRKAEELK CELSNTNIKE TLVITKKINN 
IQNEEKFLKL SKKGLEELLI EKGLLKSIEK LFKQTINSAK RNSFELKDLD SVVLVGGGSR 
IPLIKNYLSD ICNSIPFLTP PPIEAIALGA LHLTPGVQIK DVLNKGVSLR CWNKKNEKHI 
WHPLFLAGQT WPTNKPLEII LAASINSQLS IDLIIGEPQE EGSNEIIYTN GLPTLTTIES 
KDKIKKITNT IISIPVDPPG EIGQDCIKLI FNINDNCQLE VEGVDLRNNK EITKQNLGEI 
R