Gene NATL1_00161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_00161
Symbol	dnaJ
ID	4779788
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	19556
End bp	20686
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	40%
IMG OID	640083279
Product	chaperone protein DnaJ
Protein accession	YP_001013845
Protein GI	124024729
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0484] DnaJ-class molecular chaperone with C-terminal Zn finger domain
TIGRFAM ID	[TIGR02349] chaperone protein DnaJ

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.296062
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.971864
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGATT TTTACGATCT ATTGGGTGTC AGCAGAGATG CTGATGCTGA CACTTTAAAA 
AGAGCTTATA GACAGCAAGC TCGGAAATAT CACCCTGACG TCAATAAGGA AGCAGGTGCA 
GAGGATAAGT TCAAAGAAAT AGGCAAAGCA TATGAAGTTT TAAGCGACTC TCAAAAGCGA 
GCTCGTTACG ACCAATTTGG AGAAGCTGGA ATAGGTGGGG CCGCTGGCAT GCCGGATATG 
GGAGATATGG GTGGCTTTGC AGATCTGTTT GATACCTTTT TTAATGGCTT TGGTGGTGCT 
AGTTCAGCTG GAGGTTCTCG CCCTCAAAGA CGCGGACCAC AACAGGGAGA CGATTTACGT 
TACGACCTAA CGATTGATTT TGATAAAGCT ATTTTTGGAC AAGAAAAAGA GATTACGGTC 
CCTCATTTAG AAACTTGTGA TGTTTGCAGA GGCACTGGGG CTAAGAAAGG CACTGGTCCT 
GTTACTTGTT CTACATGTAG TGGTGCAGGT CAAGTAAGGA GAGCGACTCG TACACCTTTT 
GGAAGTTTTA CTCAAGTAGC TGAATGCCCA ACCTGTGGTG GTACTGGACA AGTGATTAAA 
GATCCTTGCA ACGCTTGTGG AGGGAAAGGC GTTAAACAAG TAAGAAAAAA ATTAAAAATT 
AATATTCCTG CTGGAGTTGA TAGCGGAACA CGATTAAGAG TTTCAGGAGA GGGTAATGCT 
GGATTAAAGG GTGGTCCATC TGGAGATCTA TATGTTTTTT TAAAAGTTAA AAATCATCCT 
AATTTAAAGA GAGATGGATT GACAATTTTA TCTGAGGTTA ATATTAGTTA CCTTCAGGCA 
ATTTTAGGAG ATACTATTGA AATAGAGACT GTAGATGGCC CTACTAAGTT GCAAATTCCA 
GCAGGGACCC AACCTAACTC TATTTTGAAT TTAGAAAATA AAGGAGTGCC AAAACTAGGC 
AATCCAGTTG CTAGAGGTAA TCATCAAGTC TCAGTAAAGA TTAAATTACC TACAAAATTA 
TCAGATTCTG AAAGAAATTT ATTAGAAGAA TTAGCTGGAC ATTACTCTGC ACTTGGACCA 
CAACATCATT ATCATAAAAG TGGCTTATTT AGTAAGTTAT TTGGCAAATA A

Protein sequence

MADFYDLLGV SRDADADTLK RAYRQQARKY HPDVNKEAGA EDKFKEIGKA YEVLSDSQKR 
ARYDQFGEAG IGGAAGMPDM GDMGGFADLF DTFFNGFGGA SSAGGSRPQR RGPQQGDDLR 
YDLTIDFDKA IFGQEKEITV PHLETCDVCR GTGAKKGTGP VTCSTCSGAG QVRRATRTPF 
GSFTQVAECP TCGGTGQVIK DPCNACGGKG VKQVRKKLKI NIPAGVDSGT RLRVSGEGNA 
GLKGGPSGDL YVFLKVKNHP NLKRDGLTIL SEVNISYLQA ILGDTIEIET VDGPTKLQIP 
AGTQPNSILN LENKGVPKLG NPVARGNHQV SVKIKLPTKL SDSERNLLEE LAGHYSALGP 
QHHYHKSGLF SKLFGK