Gene NATL1_04411 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_04411
Symbol
ID	4780537
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	404273
End bp	405265
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	40%
IMG OID	640083718
Product	tRNA-dihydrouridine synthase
Protein accession	YP_001014270
Protein GI	124025154
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00737] putative TIM-barrel protein, nifR3 family [TIGR00742] tRNA dihydrouridine synthase A

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.324632
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGAGT TTTCTCCGAT TTGTTTATCA GGCAATGGGA CGCCTAGATC TATAGAGTGT 
CTGGTTATTC AGTCCCCACT TGCAGGAGTG AGCGATCAAA TATTCAGGAA CTTTGTTCGT 
AGATGGTCTC CAAAAGCTTT ACTTTTCACC GAAATGGTAA ATGCTAAAAG TCTTGAATTA 
GGTCATGGTG AAGAGAAAGT AATTGAGCTT TCAGAAGAAA GTGGTCCAAT TGGTGTTCAA 
CTTTTTGACC ATAGGCCAGA TTCAATGGTA GATGCTGCCA TCAAAGCCGA ATCATCTGGT 
GCATTTCTTA TAGATATCAA TATGGGTTGC CCAGTAAAAA AAATTGCCAG GAAAGGAGGC 
GGAAGTGCTC TATTGAAAGA ACCAGAACTT GCGCAATTAA TCGTCAAAAA GGTTTCAAAA 
GCCATATCTA TTCCAGTAAC AGTCAAAATA AGATTGGGGT GGTGTGAAAC CACAAGTGAT 
CCAGTATCTT TTGCTTTAGG TCTACAGGAG GCTGGGGCTC AACTCATAAC TGTTCATGGG 
CGAACAAGAA GGCAAGGATT TTCTGGCCAT TCAAACTGGA AAGCTATTGC CCAAATCAAA 
AAGTCATTAG ATATACCTGT CATCGCTAAT GGTGATATTA AAAACTCTCG AGATGCTATT 
GAGTGCCTAA AGATCACGAA TGCCGATGGG GTGATGATAG GAAGGGCAAG TATGGGAGCT 
CCATGGCTGG TTGGACAAAT TGATGAAGAA ATTAAAAACC AAACAACTTT TAAACCACCT 
GACGCAAAGA TGAAAGTGAG CTTATCTTTA GAGCACCTAA AATTACTTGT TTCAAAGAAA 
GGAAGTCATG GGCTTTTGAT TGCTAGGAAA CATATGAATT GGACTTGTAG AGGTTTTGAG 
GGTGCGTCTA CTCTTCGCCA TAAATTAGTT AGAGCAAGCA CTCCAAACGA CGCAATTAAA 
CTACTGGAAG ACGAACTGAT TAAATTCAAC TAA

Protein sequence

MKEFSPICLS GNGTPRSIEC LVIQSPLAGV SDQIFRNFVR RWSPKALLFT EMVNAKSLEL 
GHGEEKVIEL SEESGPIGVQ LFDHRPDSMV DAAIKAESSG AFLIDINMGC PVKKIARKGG 
GSALLKEPEL AQLIVKKVSK AISIPVTVKI RLGWCETTSD PVSFALGLQE AGAQLITVHG 
RTRRQGFSGH SNWKAIAQIK KSLDIPVIAN GDIKNSRDAI ECLKITNADG VMIGRASMGA 
PWLVGQIDEE IKNQTTFKPP DAKMKVSLSL EHLKLLVSKK GSHGLLIARK HMNWTCRGFE 
GASTLRHKLV RASTPNDAIK LLEDELIKFN