Gene NATL1_00981 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_00981
Symbol
ID	4780682
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	97602
End bp	98717
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	28%
IMG OID	640083361
Product	hypothetical protein
Protein accession	YP_001013927
Protein GI	124024811
COG category	[R] General function prediction only
COG ID	[COG3380] Predicted NAD/FAD-dependent oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0926997
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.536427
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTAATA TTTATGACTT TATAGTCATA GGTGCAGGAA TATCTGCTTG TACGTTTGCA 
TCACTTTTAA ATAAAAGATT CCCTGATCTT TCTATACTAT TAGTTGAACA TGGAAGGAGA 
ATTGGTGGAA GAGCTACAAC GCGAAAATCA AGAAAAAATA GAATTCTTGA ATTTGACCAT 
GGTTTGCCAT CTATTAATTT TAGAGAACGT ATTTCAGAAG ACATATTGGA GTTAGTTTCG 
CCATTAATAA ATTCAGGAAA ATTGGTAGAT ATATCAAAGG ATATTTTATT AATCAATGAA 
TTTGGCATTT TAAGTAATGC ATTTACTAAT GATATAATTT ATCGGAGTTC TCCTTTTATG 
GCTAACTTCT GCGAGGAAAT AATTAATCAA TCTAATAACC CTAAAAAAAT AAATTTTTTA 
TTTCAAACTC TAACTAAATC AATTAAGCGT ATAAATAACT TATGGGAGGT AAAAGTTAAT 
ACTGGAAGAC ATATTAAATC TAAAAATCTG ATTTTATCCA GTTCTTTAAT AGCACATCCA 
AGATGTTTGA ATCTTCTTCA AATTAATTCT TTACCACTTA GGGATGCCTT TATTCCAGGT 
AAAGATAAAG TTGTTGATGC ATTAATAAAA GAAACAAGAA AATTAACTTA TATCATTAGA 
AAAGTTTATA TTTTTCATGT TTCTAATTTG TCTTTATCTC AAAAATTTAA TTATCAATAT 
TTACAAATTA TCTTTGCAAA TGTAATTAGA GAGGATTCAA ATTTTGAAAG AATTATTTTT 
CAAAGACAAT CTGATGGATC TATCATTATA GCCTTACACT GTTCTTGTAT AAATAATCTG 
CCCGAGATTA AGATTGATAA TATTACTAAA TCTTTGATAT CATTATTTGC AAACTATAAA 
ATATTTTTGG ATTTGTTTTT ACAAGCAACC CTTATTGATA AAATGGATTG GAGAGCTTCT 
CAACCTCTTA ATCACTTATT ATCCAAAGAA TTGCAGTGGT CTAATAGTAG TAAGATTGGT 
TTTTGTGGAG ATTGGTTTGA TCTGAATTGC AGTGTAGGCG TAGAGTCTGC AATGAATAGT 
TCACTCAGAC TGGTCAATTT TGTGAATCGG AATTGA

Protein sequence

MTNIYDFIVI GAGISACTFA SLLNKRFPDL SILLVEHGRR IGGRATTRKS RKNRILEFDH 
GLPSINFRER ISEDILELVS PLINSGKLVD ISKDILLINE FGILSNAFTN DIIYRSSPFM 
ANFCEEIINQ SNNPKKINFL FQTLTKSIKR INNLWEVKVN TGRHIKSKNL ILSSSLIAHP 
RCLNLLQINS LPLRDAFIPG KDKVVDALIK ETRKLTYIIR KVYIFHVSNL SLSQKFNYQY 
LQIIFANVIR EDSNFERIIF QRQSDGSIII ALHCSCINNL PEIKIDNITK SLISLFANYK 
IFLDLFLQAT LIDKMDWRAS QPLNHLLSKE LQWSNSSKIG FCGDWFDLNC SVGVESAMNS 
SLRLVNFVNR N