Gene NATL1_05981 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_05981
Symbol	chlN
ID	4779847
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	543854
End bp	545113
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	39%
IMG OID	640083875
Product	light-independent protochlorophyllide reductase subunit N
Protein accession	YP_001014425
Protein GI	124025309
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01279] light-independent protochlorophyllide reductase, N subunit

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.926498
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGTG CAACGCTCCT TAAAGAATCT GGTCCAAAAG AAGTCTTTTG CGGGCTAACT 
TCTATCGTTT GGCTGCATAG AAGAATGCCT GATGCTTTCT TCCTTGTTGT GGGTTCTAGA 
ACCTGTGCGC ATTTAATTCA AAGTGCAGCA GGCGTAATGA TCTTTGCTGA ACCACGCTTT 
GGAACAGCTA TTTTAGAAGA GAGAGATTTA GCTGGATTAG CTGATGCTCA TGACGAGTTA 
AACCGAGTAG TAAAAAATCT TTTAGCCAGA CGTCCCGAAA TAAAAACTCT TTTTCTTGTT 
GGCTCTTGCC CAAGTGAAGT AATAAAAATA GATCTTTCAA GGGTTGCTGA AAATCTGAAT 
ATCGAACTTA AAGGTCAAGT AACAGTATTG AATTATTCGG GAAGTGGAAT AGAAACAACT 
TTCACTCAAG GCGAAGACGG AGCTTTAAAG GCTTTGATTC CATTGATGCC GAAGAGCGAT 
CAAAAGAAAT TACTTTTAGT TGGAACTCTT GCAAATGCTG TGGAGGACCG TTTAGTAAGT 
ATTTTTAATC GGCTTGGAAT AGATAATGTT GAAAGTTTTC CACCTAGGCA GTCAACAGAA 
TTACCTTCTA TTGGTCCAGA GACCAAAGTA CTTCTTACTC AACCCTACTT AACTGATACG 
GCAAGAGAGC TTAAAAATAA AGGTGCTGAG ATAATAGAAG CGCCCTTTCC TCTAGGTGTT 
ACGGGTAGCA CATTGTGGAT TCAGGCTGCT GCAAATTCAT TTGGCATCGA TAAATCTATT 
GTTGATTCGA TATTGAATCC ACTGATATCG AGGGCAAAGA AAGCTTTGGA GCCTCATGTT 
GAGAAACTTT CTGGTAAGAA ATTGTTCCTT TTGCCAGAAT CTCAATTAGA AATACCTCTC 
GCAAGATTTC TAAGTAATGA GTGTGGAATG GAGATTGTTG AAATAGGAAC GCCTTATTTA 
AATAGAGATT TAATGAAAGC AGAAATAGAC TTGCTACCTC CTGATTGTCG TATTGTCGAA 
GGACAACATG TAGAGAAACA ATTAGACAGA GTAAGAGATA GTTCGCCAGA TCTTGTTGTT 
TGTGGAATGG GACTTGCCAA TCCACTTGAA GCAGAGGGGA TATCAACCAA ATGGTCAATT 
GAAATGGTTT TCAGCCCAAT TCACGGGATT GATCAAGCTT CAGATTTAGC AGAATTGTTT 
TCAAGGCCAC TTCGCAGGCA TGACATTTTA AATCCTACTA AAACTCTTAC ATCAAACTAA

Protein sequence

MSGATLLKES GPKEVFCGLT SIVWLHRRMP DAFFLVVGSR TCAHLIQSAA GVMIFAEPRF 
GTAILEERDL AGLADAHDEL NRVVKNLLAR RPEIKTLFLV GSCPSEVIKI DLSRVAENLN 
IELKGQVTVL NYSGSGIETT FTQGEDGALK ALIPLMPKSD QKKLLLVGTL ANAVEDRLVS 
IFNRLGIDNV ESFPPRQSTE LPSIGPETKV LLTQPYLTDT ARELKNKGAE IIEAPFPLGV 
TGSTLWIQAA ANSFGIDKSI VDSILNPLIS RAKKALEPHV EKLSGKKLFL LPESQLEIPL 
ARFLSNECGM EIVEIGTPYL NRDLMKAEID LLPPDCRIVE GQHVEKQLDR VRDSSPDLVV 
CGMGLANPLE AEGISTKWSI EMVFSPIHGI DQASDLAELF SRPLRRHDIL NPTKTLTSN