Gene P9303_00141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_00141
Symbol
ID	4775971
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	-
Start bp	17882
End bp	18886
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	54%
IMG OID	640085513
Product	tRNA-dihydrouridine synthase A
Protein accession	YP_001016036
Protein GI	124021729
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00742] tRNA dihydrouridine synthase A

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGTTC CTTTCACGCC ACAGGTTGAT GGTGCTTATC GGTTCAGCGT GGCTCCAATG 
CTCGACTGCA CAGATCGACA CTTCAGGGTA CTAATGCGAC AAATCAGTCG CCGGGCGTTG 
CTTTACACGG AAATGTTGGT TGCCCAAGCT CTGCATCACA GCAACCGTCT TGATCATCTG 
CTCGATTTCG ACATCATCGA GCATCCCCTG TCTCTACAAG TAGGGGGCGA TGATCCAAAA 
ATGCTTGCAG AAGCAGCGCG CCTGGCCGAT GCCTGGGGCT ACGACGAAAT CAACCTCAAC 
GTGGGATGTC CCAGCTCAAG AGCAAAAGCA GGCAACTTCG GTGCCTGCCT AATGGCTAAA 
CCTGATCAAG TCGCACGTTG TGTTGAAGCG ATGGCGATGG CGAGCCCTCT TCCAGTCACC 
GTGAAACACC GTCTAGGAAT TGATGATTTC GATAGCGACG CTCTACTCAT GACCTTTGTC 
GACCGAGTGT CCCTCGCAGG AGCCACTCGC TTTACTGTGC ATGCACGAAA AGCCTGGCTA 
GAAGGGCTTG ACCCCAAACA AAACCGCACG ATTCCACCAC TTCAACATCA ACGAGTCACC 
CATCTCAAGC AACAACGCCC GCAGCTCACT ATTGAAATCA ATGGAGGACT AGAACACCCT 
GCCGACTGCC TAACAGCGCT GCAAACCTGT GATGGGGCAA TGGTGGGGCG AGCAGCGTAT 
GCGCATCCGC TCCGCTGGAA GAGCATGGAT GAGCTGGTCT ATGGAGAAGA ACCACGCTCA 
ATCAATGCTT CTCAAGTCAT AGGAGGATTA CTCCCTCATG CCGAAACCCA CCTGAGCCGA 
GGTGGCCGGC TATGGGATCT TTGCCGACAT CTTTTACAAC TCGTTGAAGG GGTACCGGGC 
GCCAAATCCT GGAGGCGAGA CCTTGGCATC AAGGCTCAAA AAGCCGATGC CGATCTAACA 
GTGCTGCAAA AAGCAGCCCA GCAACTTGAA GATGCCGGGC TATAA

Protein sequence

MIVPFTPQVD GAYRFSVAPM LDCTDRHFRV LMRQISRRAL LYTEMLVAQA LHHSNRLDHL 
LDFDIIEHPL SLQVGGDDPK MLAEAARLAD AWGYDEINLN VGCPSSRAKA GNFGACLMAK 
PDQVARCVEA MAMASPLPVT VKHRLGIDDF DSDALLMTFV DRVSLAGATR FTVHARKAWL 
EGLDPKQNRT IPPLQHQRVT HLKQQRPQLT IEINGGLEHP ADCLTALQTC DGAMVGRAAY 
AHPLRWKSMD ELVYGEEPRS INASQVIGGL LPHAETHLSR GGRLWDLCRH LLQLVEGVPG 
AKSWRRDLGI KAQKADADLT VLQKAAQQLE DAGL