Gene NATL1_21081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_21081
Symbol
ID	4781108
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	1762248
End bp	1763369
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	25%
IMG OID	640085404
Product	hypothetical protein
Protein accession	YP_001015928
Protein GI	124026813
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG2227] 2-polyprenyl-3-methyl-5-hydroxy-6-metoxy-1,4-benzoquinol methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.781663
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATACT CTGACTTTTA TTTAGCCTTC GAAAATAAAT TTCGTGGGAG CTCTGTAGAT 
GTTAATGAAA AATTAGTTTT TTATGATGGT TTGCTTGAAG AGATTAGTTC TAGATTTAGT 
CATTGTAATC TTTTGGATAT AGGTTGTGGT CGTGGCGAGT GGCTTGCTAA ATGTTCAGAT 
CTAGGTATAA ATTCAATTGG TATAGATAAC AATGATAGTA TGTTTAATAC CTGTAAAAGA 
CAAGGCTTAA ATATTAAGTA TGGTGAAGCA TTAGATATTT TAAAAACTTT AGAGAATAAT 
TCTTTTCATA TGATTAGTTC GTTTCATTTT ATAGAACATA TTTCATTTAG TATGTTTTTA 
GAAATTTTAG AAGAATGCAA AAGGCTTCTT ATTCCAGGAG GTGTTTTGAT TTTTGAGACA 
CCAAGTATTG ATAATATCTT AGTATCTTCA AAAGATTTTT ATTTGGATCC TACTCATGTA 
TCTCATATAC ATCCAGAGAC AGTAATATTT GCATTAAATT ATTTTAAATT CACAGAGTCA 
AAATATTTTT TAATTAATAA ACCCTTATAC CAAAAATATG GAGATGATAG TATTTATAAT 
ATCTTAAATG GAGCGGGACT AGATGTTTCT ATAATAGCTT CTTATAATGT TAACCCTCAA 
GCAGTCTCAA TATTTGATCA GAGTTTAAAT TGGATTAATA ATCTAAAGAC TTCTAAAAAT 
ACTTTTGAAA AATCTAATGA ATATGATAAT TTAATCAATA ATAAAATGAT TGATCTTAGT 
AGAAGAATTG ATTTTTTAAA TAATCAGTTA GATACTTTAT TTCGTATATA TGAAAAATTT 
TTTAATAGCT TTCCTCTTAA AGTTTTAAGA AAGATCAATG CCGTAACTCA TCTAATCAAG 
GCAATTTGTG TTAAAATCTT TAAGATTTCG ATTTCCAAAA TCTTAAAGAT ATATTTACTA 
GAGAAAGCTT ATTTAAAAAT TTCTAAATTA TTTTTTAAGG ATAAATTAGA TTTGTATGCT 
CATTCTAAAA ATGATAGTTA TTTAAAAAAA TTTTTTCAGT CTAATCCAAG ATCAAAGGAA 
ATATTGTTAG ACATTAAATC TAAATCTAAA CCAAAGCTTT AG

Protein sequence

MKYSDFYLAF ENKFRGSSVD VNEKLVFYDG LLEEISSRFS HCNLLDIGCG RGEWLAKCSD 
LGINSIGIDN NDSMFNTCKR QGLNIKYGEA LDILKTLENN SFHMISSFHF IEHISFSMFL 
EILEECKRLL IPGGVLIFET PSIDNILVSS KDFYLDPTHV SHIHPETVIF ALNYFKFTES 
KYFLINKPLY QKYGDDSIYN ILNGAGLDVS IIASYNVNPQ AVSIFDQSLN WINNLKTSKN 
TFEKSNEYDN LINNKMIDLS RRIDFLNNQL DTLFRIYEKF FNSFPLKVLR KINAVTHLIK 
AICVKIFKIS ISKILKIYLL EKAYLKISKL FFKDKLDLYA HSKNDSYLKK FFQSNPRSKE 
ILLDIKSKSK PKL