Gene NATL1_01391 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_01391
Symbol
ID	4779597
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	136586
End bp	137668
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	38%
IMG OID	640083403
Product	hypothetical protein
Protein accession	YP_001013968
Protein GI	124024852
COG category	[S] Function unknown
COG ID	[COG3330] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACTTTTG ATCAAGAATC CCTGTCACGT TTAACACTTC GTCAGCTTCG TACAAAAGCT 
AGTGAATTAG GTATTCCTCT TTATAGTAGA AAATCTAAGG CCGATTTAGT TAAGGGTGTA 
TTGCTGTACG AAGAAAAAAA GGAATTAGAA AAACAGTTGA TAAACAATAA AGTCCAACCA 
TCAAGCGAAA CTACATATCA AAATTCATCA GAGACCAAAG TCGTTTTTCT TCCTCGTGAT 
CCCGAGTGGG CATATATATT TTGGGAGATA TCAGATTCTG ATCGTTCTAA TGCTCAAAAA 
GAAGGTGCTA TTAGGCTTTG TTTGCGTTTA GCTGATGTCA CCAATAAAAA TAATGGAGAG 
ACTAATCCTG GAACTCTTCA AGAAATTGTT GTTGATAGTC ACAGTACGGA GTGGTACTTA 
CCTATTCCTT TAGCTGGAAG AGACTACAAG GTTGAACTCG GTTATCGAAT TGGTCATAAA 
TGGATGTCAC TCGCTCATTC ATCTTCAGCC AAAGTACCTT CACTTCATCC AAGTGAGCAA 
ATTCTTGATC AATTTGTTCC TTTTAGTCTA GAAGCCCCAG TTACTACTTC CTCTGATTCT 
AAGATAGAAA GTTTTGCATC AGAACAACCA GACAGTGGTT TGCATGAGCG TTTATATCAA 
TCAGCGACCA CAAAATTTAG AACTAGAAGA GTTGGTTCAG AAGAATTCCA AGAGGGTTTC 
CCAGGAGATC TAAATTCAAA TAATGAATCT GGTAGTGGGC TTTGGGCTAG TGGCTTGAAT 
GAATCTGGTA TTGGTGGGGT TCCTCAAGCT CGTTCTTTTT GGTTGGTTGC TGATGCGGAA 
TTAATTGTGT ATGGAGCTAC TGATCCCTCA GCTAAATTGT TTATCGAAGA TGAAGAGGTC 
CCACTAGGAA ATGATGGAAC TTTTAGATTG CAAGTCCCAT TCAGAGACGG TATTCAGAAC 
TATTCAATTA AAGCTATTGA TAAAGATGGT GTTGATTCAA GGAACATAAC AATGAAATTC 
GAAAGAGTTA CTCCAGTTGA TAACACTAAC CCAAATTCCA AAGCTGAATC AGAATGGTTT 
TAA

Protein sequence

MTFDQESLSR LTLRQLRTKA SELGIPLYSR KSKADLVKGV LLYEEKKELE KQLINNKVQP 
SSETTYQNSS ETKVVFLPRD PEWAYIFWEI SDSDRSNAQK EGAIRLCLRL ADVTNKNNGE 
TNPGTLQEIV VDSHSTEWYL PIPLAGRDYK VELGYRIGHK WMSLAHSSSA KVPSLHPSEQ 
ILDQFVPFSL EAPVTTSSDS KIESFASEQP DSGLHERLYQ SATTKFRTRR VGSEEFQEGF 
PGDLNSNNES GSGLWASGLN ESGIGGVPQA RSFWLVADAE LIVYGATDPS AKLFIEDEEV 
PLGNDGTFRL QVPFRDGIQN YSIKAIDKDG VDSRNITMKF ERVTPVDNTN PNSKAESEWF