Gene NATL1_12111 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_12111
Symbol
ID	4779423
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	1060594
End bp	1062123
Gene Length	1530 bp
Protein Length	509 aa
Translation table	11
GC content	37%
IMG OID	640084490
Product	hypothetical protein
Protein accession	YP_001015034
Protein GI	124025918
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1233] Phytoene dehydrogenase and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAAATC CTGAAGTAAT AGTTATTGGA AGTGGTATAG GAGGTTTATG TTGCGGCGGA 
CTACTCGCAA AAGCAGGTAA AAAGGTCCTA ATTCTTGAGG CTCACTCAAA GCCAGGAGGT 
GCTGCTCATG GCTTTGAGAA AAATGGTTAT AAGTTTGAAT CTGGTCCATC TCTATGGAGT 
GGAATAGGTA GTTGGCCTAC TACAAATCCT TTAGGTCAGG TCCTTAAAGC TCTTAACCAA 
AAAGTTGATT TAATTAAATA TCAGGATTGG AATGTTCAAA TTCCTGAGGG TGACTACACA 
ATTGGAGTTG GAGATAGACG TTTTCTTGAT CAGATCAATT CAATTAGCGG AAAAGATGCC 
ATTAAAGAGT GGGAAAATTT TATTCAAGTT ATTAAACCTA TTGGTGCAGC AGCTAATGCA 
ATTCCTTTAT TAGCTCTAAA TCAAAACAAG GAAACCGTTT TTCAGCTGTT AAAACGTAGT 
AAAACACTTA TCACACACTT GAAATCTTTT AAATATCTTG GAGGTGATTT TGGAAATTTA 
GTTGATGACC ATCTTAAAGA TCCATTTTTA AGAAATTGGG TTGAATTACT TTGTTTTCTA 
ATAAGTGGTT TATCTAAAGA CGAAACAAAT GCAGCAGCTA TGGCAACACT TTTTGATGAT 
TGGTTTAAAC CCGATGCCTA CTTGGAATAT CCAAAGGGAG GAAGTGAATC AATCGTTAAG 
GCACTATTGG AAGGGATTTA CTCATTTGGA GGGGATCTTC AACTAAATTC AAAAGTTAGT 
CAGATAATAA TAGAAAGGAA TAAAGCAATC GGAATTGAAT TGAAAAACGG TGAGAAAATA 
TTTGCAGATC ATATAGTTAG CAATGCAGAT ATTTGGAATA CCGTTGAGTT AATACCAAAA 
GAGATATCCC AACAGTGGAG AGAGAAAAGG TCAAGGACTC CAAAATGTAA GTCATTTCTT 
CATCTACATC TTGGGTTTAA TGCAGAAGGA CTAGATGATA TTCCACTTCA TTCAATATGG 
GTTAATGATT GGTCTAAGGG TATTACAGCC GAGAGAAATG TTGTAGTTCT CTCTATTCCT 
TCGGCATTAG ATCCAACAAT GTCTCCACCA AATAAGCACA TACTTCATGG GTATACACCT 
GCGAATGAAC CGTGGGAAAG ATGGGAGGGG CTTAAAATTG GTTCAAAAGA ATATGAAAGT 
ACAAAAGAAG AGAGGTGCTC AGTCTTCTGG GAACCAATAA AAAAATTAGT GCCTGATATA 
GAAGAAAGAA TCGAAGTGAA AATGCTAGGA ACACCACTTA CACATGAACG GTTTTTAAAT 
ACAAAAAATG GAAGTTATGG TCCAGCCTTA TCAGCTGCAG AAGGGCTTTT CCCAGGAAAT 
AAAACTCCAA TTAAAAATCT ATTGTTGTGT GGCTCAAGTA CATTCCCAGG GATCGGGATA 
CCACCTGTAG CAGCCAGTGG TGCCATGGCC GCCAATACAA TTCTTGGATC CAAATTTCAA 
AGAGATCTAA TTGAAGAGCT AGGCATATAA

Protein sequence

MRNPEVIVIG SGIGGLCCGG LLAKAGKKVL ILEAHSKPGG AAHGFEKNGY KFESGPSLWS 
GIGSWPTTNP LGQVLKALNQ KVDLIKYQDW NVQIPEGDYT IGVGDRRFLD QINSISGKDA 
IKEWENFIQV IKPIGAAANA IPLLALNQNK ETVFQLLKRS KTLITHLKSF KYLGGDFGNL 
VDDHLKDPFL RNWVELLCFL ISGLSKDETN AAAMATLFDD WFKPDAYLEY PKGGSESIVK 
ALLEGIYSFG GDLQLNSKVS QIIIERNKAI GIELKNGEKI FADHIVSNAD IWNTVELIPK 
EISQQWREKR SRTPKCKSFL HLHLGFNAEG LDDIPLHSIW VNDWSKGITA ERNVVVLSIP 
SALDPTMSPP NKHILHGYTP ANEPWERWEG LKIGSKEYES TKEERCSVFW EPIKKLVPDI 
EERIEVKMLG TPLTHERFLN TKNGSYGPAL SAAEGLFPGN KTPIKNLLLC GSSTFPGIGI 
PPVAASGAMA ANTILGSKFQ RDLIEELGI