Gene CPF_2201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2201
Symbol	tgt
ID	4202383
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	2441353
End bp	2442495
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	33%
IMG OID	638083066
Product	queuine tRNA-ribosyltransferase
Protein accession	YP_696625
Protein GI	110799191
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0343] Queuine/archaeosine tRNA-ribosyltransferase
TIGRFAM ID	[TIGR00430] tRNA-guanine transglycosylase, queuosine-34-forming [TIGR00449] tRNA-guanine transglycosylases, various specificities

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTAAAA AAAGATATAC TCTTTTAAAA AAAGACGGAA AAGCTAGAAG GGGTGAGTTT 
GTAACTCCTC ACGGTACAAT TCAAACTCCT GTTTTTATGA ATGTAGGAAC TTTAGCAGCT 
ATAAAAGGTG CTGTTTCTTC AATGGATTTA AAAGAAATAG GATGTCAAGT AGAGCTTTCT 
AATACATACC ATTTACATTT AAGACCAGGA GATAAGATTG TAAAGCAAAT GGGAGGCTTA 
CATAACTTTA TGAATTGGGA TAGACCAATC TTAACAGATT CAGGTGGATT CCAAGTTTTC 
TCATTAGCAG GAATGAGAAA GATAAAAGAA GAGGGAGTTT ATTTTAACTC ACACATAGAT 
GGTAGAAAAA TATTCATGGG ACCAGAAGAA AGTATGCAAA TACAAAGTAA TTTAGGTTCA 
ACAATAGCTA TGGCTTTTGA TGAATGTATT CCAAATCCAT CAACTAGAGA ATATGTAGAA 
AAGTCAGTTG CAAGAACAAC AAGATGGCTT GAAAGATGTA AAAAAGAAAT GGATAGATTA 
AATTCATTAG ATGACACTGT TAATAAAGAG CAAATGCTTT TTGGTATTAA CCAAGGTGGA 
GTTTATGAAG ATATAAGAAT AGAACATGCT AAAACTATAA GAGAAATGGA TTTAGATGGA 
TATGCTATTG GAGGATTAGC GGTTGGAGAA ACTCATGAAG AAATGTATAG AGTTATAGAT 
GCTGTAGTTC CTCACTTGCC AGAGGATAAA CCAATATATT TAATGGGGGT TGGTCTTCCA 
TCAAATATAT TAGAAGCAGT AGAAAGAGGA GTAGACTTCT TTGATTGTGT TTTACCTGCT 
AGAAATGGAA GACATGGTCA TGTTTTCACT AAAGAAGGTA AAATAAACTT AATGAATGCT 
AAGTTTGAAT TAGATGCTAG ACCAATAGAT GAAGGATGTC AATGTCCTGC ATGTAAAAAT 
TACACAAGAG CATATATAAG ACACTTATTT AAGGCTAAAG AAATGTTAGC TATGAGATTA 
TGTGTTCTTC ACAATCTATA CTTCTATAAT AAGCTTATGG AGGATATAAG AGATGCTATA 
GATGGCGGAT ACTTTGCAGA ATTCAAAGCT AAAAAATTAG AAGAGTGGAA TGGAAGAGCT 
TAA

Protein sequence

MTKKRYTLLK KDGKARRGEF VTPHGTIQTP VFMNVGTLAA IKGAVSSMDL KEIGCQVELS 
NTYHLHLRPG DKIVKQMGGL HNFMNWDRPI LTDSGGFQVF SLAGMRKIKE EGVYFNSHID 
GRKIFMGPEE SMQIQSNLGS TIAMAFDECI PNPSTREYVE KSVARTTRWL ERCKKEMDRL 
NSLDDTVNKE QMLFGINQGG VYEDIRIEHA KTIREMDLDG YAIGGLAVGE THEEMYRVID 
AVVPHLPEDK PIYLMGVGLP SNILEAVERG VDFFDCVLPA RNGRHGHVFT KEGKINLMNA 
KFELDARPID EGCQCPACKN YTRAYIRHLF KAKEMLAMRL CVLHNLYFYN KLMEDIRDAI 
DGGYFAEFKA KKLEEWNGRA