Gene NATL1_03501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_03501
Symbol	tgt
ID	4781249
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	323737
End bp	324867
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	39%
IMG OID	640083617
Product	tRNA-guanine transglycosylase
Protein accession	YP_001014179
Protein GI	124025063
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0343] Queuine/archaeosine tRNA-ribosyltransferase
TIGRFAM ID	[TIGR00430] tRNA-guanine transglycosylase, queuosine-34-forming [TIGR00449] tRNA-guanine transglycosylases, various specificities

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAAAAGC CCTTATTCGA TTTCCAAATA AAAAGTAGAT GCAAAACGAC ATTAGCTCGT 
GTCTGTTCTT TTAAAACTCC AAATGGAATT GTAAATACTC CAAAATTCAT GCCTGTTGGG 
ACTTTAGGAA CAGTCAAAGG AGTTACATCT CAGCAACTTG AGAAAACAGG GGCTGAAATG 
ATTCTTGCAA ATACTTTTCA TCTTCATCTT CAACCAGGAG AAAAAATAGT TCAAGATGCA 
GGGGGACTAC ATAAATTTAT GAGTTGGAAT AAACCAATTC TTACTGACTC AGGAGGCTTT 
CAAGTATTTA GTTTGGCAAA ATTAAATAAA ATAGATGATC AAGGAGTCTC GTTTCAAAGT 
CCAAGAGATG GTAAACATAT CTATTTAACT CCTGAAAAAG CTATTGAAAT TCAAATGGCT 
TTAGGGTCAG ATGTGGCAAT GGCTTTTGAT CAATGTCCCC CTTACCCAGC AAGCGAATCA 
GACGTTGAGG AGGCTTGCAA GAGAACCCAT CATTGGTTGG AGAGATGTTT AAATGCTCAT 
AAGAAAAATG ATCAAGCAGT TTTTGGAATA GTTCAAGGTG GTTGCTTCCC TCATTTAAGG 
GAATTGAGTG CAAAAATTGT CTCAGGATTT GGTTTGCCAG GGATTGCTAT TGGAGGAGTA 
AGCGTAGGTG AACCCATAAA TCAAATGCAC AAAATCGTAC GAGAAACCTG TCCTTTATTA 
CCTCAAGATC GACCTAGATA CTTAATGGGA ATTGGAACCT TAAAAGAAAT GGCCATTGCA 
GTTGCAAATG GAGTTGACAT GTTCGATTGT GTAATTCCTA CGCGGCTGGG AAGGCATGGA 
AGCGCATTAG TTAATGGAGA GACATGGAAT CTAAGGAATT CACGTTTTAA AGACGATTAC 
AGCCCATTAG ACTCAACATG TACTTGTGAA GCTTGTACGG GATATTCAAG GGCATATATT 
CATCATTTAA TTCGCAATAA AGAATTACTA GGTCTTACAC TTTTGAGTAT GCACAATCTT 
ACTCATTTGA TACGTTTTAC AGGTGCTATG AGGCAAGCAA TTACTGAAGG TTGTTTTTCA 
GAGGATTTCG CTCCGTGGCA GAGTGACTCT AAAGCGCGTC ATACGTGGTA G

Protein sequence

MKKPLFDFQI KSRCKTTLAR VCSFKTPNGI VNTPKFMPVG TLGTVKGVTS QQLEKTGAEM 
ILANTFHLHL QPGEKIVQDA GGLHKFMSWN KPILTDSGGF QVFSLAKLNK IDDQGVSFQS 
PRDGKHIYLT PEKAIEIQMA LGSDVAMAFD QCPPYPASES DVEEACKRTH HWLERCLNAH 
KKNDQAVFGI VQGGCFPHLR ELSAKIVSGF GLPGIAIGGV SVGEPINQMH KIVRETCPLL 
PQDRPRYLMG IGTLKEMAIA VANGVDMFDC VIPTRLGRHG SALVNGETWN LRNSRFKDDY 
SPLDSTCTCE ACTGYSRAYI HHLIRNKELL GLTLLSMHNL THLIRFTGAM RQAITEGCFS 
EDFAPWQSDS KARHTW