Gene NATL1_08211 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_08211
Symbol
ID	4780400
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	755286
End bp	756386
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	39%
IMG OID	640084096
Product	putative oxidoreductase
Protein accession	YP_001014644
Protein GI	124025528
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.839284
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAATA CAGATCATCC GATTCGCATA GCAATTGCAG GACTAGGTTT CGGTGAAAGT 
GTTCATATTC CTGCATCATT ATCTAATAAG AATATTGAGC TTGTGGGATT GTGGCATCCT 
CGGCCAGAAA GGCTTAAAGA AGCCTGCAAT AAGCACAATC TTCGTGCCTA CGAGACCTGG 
GAGGATTTAG TAAATGACTC CAAAGTAGAT GGAATAATCA TAGCTACTCC GCCAGCTCCC 
AGATACGAGC TTGCACTAGA GGCAATTAAA GGAGGAAAAC ATCTTTTACT TGAAAAGCCA 
ACTTGTTTAA ATGCTTATGA GGTGATGGAG CTTCAAAGAA ACGCTCTCAA AAGAAATTTA 
AAAATAGCTG TTGATTACGA ATATCGGGCT GTTCCACTAT TCATGCAAGC AAAGCGAATA 
ATTACCGAGA AGAAACTAGA TGAACCATAT TTTGTAAAGC TTGATTGGCT AATGAGTAGC 
AGGGCTAATC CAGATAGGCC ATGGAATTGG TATTCAGATG AAAATTCTGG TGGAGGGGTA 
CTAGGAGCCT TGGGAACCCA TGCTTTTGAC ATGATTCATT GGCTAATTGG TCCTACTCAT 
TCTTTGAGCG CAATAAATTC AACTTCAATT AAAGAAAGAG AGTGTCCACA ATCAAAAACC 
ATTAAAAAAG TGACCAGTGA AGATGTAAGT ATTTCTCAAC TACAAATAAA AAGCATTAAT 
AACAATTTAA TTCCAGCCCA AGTAAATTTA TCTGCCGTAA CAAAACAAAG TAGGGGTTTT 
AGTCTGGAAA TCTATGGAAG CAATGGAACA CTTGTTCTTA GCAGCGAGAA CCAGAACGAT 
TATGTTCACG GATTTGGGCT TTGGTACTCA AATAAAGGAG ACGTTCTTAA AAATTTCCAA 
CCTGACTCTG ACCTATCTTT TTCAAAAATA TGGAAAGATG GTCGAATAGC TCCAGTAGCA 
AGAATCCAAA ACTGGTGGGC TCAAAGCATT GCAGATGGAA CCCCAGTAAT TCCAGGCTTA 
GTCGAGGGAT TAGCCAGCCA AATAGTTTGC GATAAGGTAA AGGAATCAAA CTCAATAGGT 
ATGAAGATAG AAATCAATTG A

Protein sequence

MINTDHPIRI AIAGLGFGES VHIPASLSNK NIELVGLWHP RPERLKEACN KHNLRAYETW 
EDLVNDSKVD GIIIATPPAP RYELALEAIK GGKHLLLEKP TCLNAYEVME LQRNALKRNL 
KIAVDYEYRA VPLFMQAKRI ITEKKLDEPY FVKLDWLMSS RANPDRPWNW YSDENSGGGV 
LGALGTHAFD MIHWLIGPTH SLSAINSTSI KERECPQSKT IKKVTSEDVS ISQLQIKSIN 
NNLIPAQVNL SAVTKQSRGF SLEIYGSNGT LVLSSENQND YVHGFGLWYS NKGDVLKNFQ 
PDSDLSFSKI WKDGRIAPVA RIQNWWAQSI ADGTPVIPGL VEGLASQIVC DKVKESNSIG 
MKIEIN