Gene NATL1_15861 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_15861
Symbol
ID	4779541
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	1292899
End bp	1293990
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	36%
IMG OID	640084868
Product	GTP-dependent nucleic acid-binding protein EngD
Protein accession	YP_001015408
Protein GI	124026292
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0012] Predicted GTPase, probable translation factor
TIGRFAM ID	[TIGR00092] GTP-binding protein YchF

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.100082
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTAAGG CCGGAATTGT TGGACTCCCT AATGTTGGGA AGTCCACCTT GTTCAATGCT 
CTTGTTGCGA ATGCTCAAGC TCAAGCAGCA AACTTTCCAT TTTGTACGAT TGAACCCAAT 
GTAGGCTCTG TTTCAGTCCC TGACCAACGT TTGAATTTGC TTGGTGAACT TAGTAATAGT 
AAGCAAATTA TTCCAACGAG AATGGAGTTT GTTGATATTG CTGGTCTTGT TAAGGGAGCA 
AGTAAAGGGG AGGGACTGGG TAACAAGTTT TTAGCAAATA TAAGGGAAGT GGATGCAATA 
GTTCATGTGA TTAGATGTTT TAGAGATGAT GATGTTATTC ATGTTTCTGG ATCAGTAGAC 
CCATCAAGAG ATATTGAGAT AATAAATTTA GAATTAGCAT TGTCTGATTT AAATCAAATA 
GAAAAACGTA GAACTCGATT AAAAAAACAA ATAAGCACTA TTAAGGAAGC AAAGTTAGAA 
GATGATGTAT TGGAAAAATT AAGCGAGGCT CTAGAAAATG AAAATGCAGT TAGGAGTGTT 
TCCTTAACTG ATGAAGAAAA GAAATTAATT AAACCATTAG GCTTATTAAC TGAAAAACCA 
ATTATTTATG CAACTAATCT TGGGGAAGAT GAACTTGCGA AGGGTAATTC CTTTTCAGAT 
GAAGTAAATA CACTCGCAAC GAAAGAAGGG TCTGAATGTG TGAAGATTTC AGCGCAAGTT 
GAAGCTGAGT TAATTGAATT GGGGGAGGAG GAAAGAGATG ATTATCTAAA TGGTTTAGGA 
GTTGAAGAAG GAGGCTTAAT TAGTCTTATT AAAGCTACAT ATCGATTGTT GGGTTTAAGC 
ACTTATTTCA CTACTGGAGA AAAAGAAACT AAAGCTTGGA CTATTTCTGA TGGGATGACA 
GCTCCTCAAG CTGCCGGGGT AATACATACA GATTTTGAAA AGGGATTTAT TCGAGCTCAA 
ACAATCTCAT ACAAAAAACT ACTTGAAGCA GGATCTTTAG TGGAAGCTCG AAACAAAGGT 
TGGCTTAGAA GTGAAGGTAA AGAATATGTA GTTAATGAAG GAGACGTTAT GGAGTTTTTA 
TTCAACGTCT AA

Protein sequence

MLKAGIVGLP NVGKSTLFNA LVANAQAQAA NFPFCTIEPN VGSVSVPDQR LNLLGELSNS 
KQIIPTRMEF VDIAGLVKGA SKGEGLGNKF LANIREVDAI VHVIRCFRDD DVIHVSGSVD 
PSRDIEIINL ELALSDLNQI EKRRTRLKKQ ISTIKEAKLE DDVLEKLSEA LENENAVRSV 
SLTDEEKKLI KPLGLLTEKP IIYATNLGED ELAKGNSFSD EVNTLATKEG SECVKISAQV 
EAELIELGEE ERDDYLNGLG VEEGGLISLI KATYRLLGLS TYFTTGEKET KAWTISDGMT 
APQAAGVIHT DFEKGFIRAQ TISYKKLLEA GSLVEARNKG WLRSEGKEYV VNEGDVMEFL 
FNV