Gene P9211_05471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_05471
Symbol	chlN
ID	5731252
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	-
Start bp	513073
End bp	514329
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	41%
IMG OID	641284906
Product	light-independent protochlorophyllide reductase subunit N
Protein accession	YP_001550432
Protein GI	159903088
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01279] light-independent protochlorophyllide reductase, N subunit

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGCG CATCGCTGCT AAAGGAAACA GGGCCTAGAG AAGTCTTCTG TGGACTTACA 
TCCATTGTTT GGCTTCATCG AAGAATGCCC GATGCCTTTT TTCTTGTTGT TGGATCAAGA 
ACATGTGCGC ACTTAATTCA AAGTGCTGCT GGCGTCATGA TCTTTGCAGA GCCACGTTTT 
GGAACTGCCA TCCTCGAAGA GAGAGATCTG GCTGGATTAG CAGATGCTCA TGAGGAACTT 
GACCGAGTAG TAAAAAATCT TCTAACAAGG CGTCCAGAAA TTCGAACTTT ATTTCTTGTT 
GGCTCGTGCC CTAGTGAAGT GATCAAAATT GATCTAGCAA GGGCTGCTGA AAGACTTAAT 
TCTCAATTCA ATGGAAAAGT AACCATCCTC AATTATTCAG GAAGTGGAAT TGAGACAACT 
TTCACTCAAG GAGAAGATGG TGCTCTTAAA GCTTTTGTCC CATTAATGCC ATCTAGCGAT 
AAAAAACAAT TGCTATTAGT TGGCACATTG GCAAATGCAG TTGAAGATCG TTTAATCACA 
ATATTCAAAA GACTAGGCAT AGAGAACGTT GATAGTTTCC CGCCTAGACA ATCCACGGAG 
TTACCTTCGA TTGGGCCAGA AACGAAAGTT CTACTAACTC AGCCATATTT AACAGATACT 
GCAAGGGTCC TGAAAGACAG AGGTGCTGAA ATACTTCCAG CACCTTTCCC ACTAGGAGTT 
GAAGGCAGCA GACTTTGGAT AGAAGCAGCC GCTAAATCTT TTAATGTTGA CCAATCATTA 
GTTACTTCAA CATTAGAACC TTTAATTTTA CGTGCTCGAA AAGCCCTTAA GCCCTATATA 
GAAAAACTGA CTGGAAAAAA ACTCTTTCTT TTACCTGAAT CACAATTAGA GATACCACTT 
GCACGTTTTC TACATATGGA ATGTGGAATG GAACTTCTAG AGATTGGGAC CCCTTATTTA 
AATAGGGACA TGATGAAACC TGAGCTAGAT CTTCTCCCTG ATAAAACTCG AATTGTTGAA 
GGACAACACG TAGAAAAGCA GCTTGATCGT GTTCGTAAAA ACCAACCAGA CCTTGTTGTA 
TGTGGGATGG GGCTTGCTAA TCCACTCGAA GCAGAAGGCT TTTCCACTAA ATGGTCAATT 
GAAATGGTAT TCAGCCCAAT CCATGGAATA GATCAAGCAT CAGACCTTGC AGAACTTTTT 
TCAAGGCCCC TTCACCGCCA CGATCTTTTA AATACCAAAC AACTCACAAG CACTTAA

Protein sequence

MSGASLLKET GPREVFCGLT SIVWLHRRMP DAFFLVVGSR TCAHLIQSAA GVMIFAEPRF 
GTAILEERDL AGLADAHEEL DRVVKNLLTR RPEIRTLFLV GSCPSEVIKI DLARAAERLN 
SQFNGKVTIL NYSGSGIETT FTQGEDGALK AFVPLMPSSD KKQLLLVGTL ANAVEDRLIT 
IFKRLGIENV DSFPPRQSTE LPSIGPETKV LLTQPYLTDT ARVLKDRGAE ILPAPFPLGV 
EGSRLWIEAA AKSFNVDQSL VTSTLEPLIL RARKALKPYI EKLTGKKLFL LPESQLEIPL 
ARFLHMECGM ELLEIGTPYL NRDMMKPELD LLPDKTRIVE GQHVEKQLDR VRKNQPDLVV 
CGMGLANPLE AEGFSTKWSI EMVFSPIHGI DQASDLAELF SRPLHRHDLL NTKQLTST