Gene Noc_0856 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0856
Symbol	truD
ID	3707161
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	936678
End bp	937754
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	55%
IMG OID	637737358
Product	tRNA pseudouridine synthase D
Protein accession	YP_342899
Protein GI	77164374
COG category	[S] Function unknown
COG ID	[COG0585] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00094] tRNA pseudouridine synthase, TruD family

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGGCGG ATGAGGCTGG GCAGCAAGTG CTTGCCTATG GCGGAGATCC GCCTTTGGCA 
ACCGCCCTGC TTCGGTGTCG CCCAGAGGAC TTCCAGGTGG TTGAGGAACT TCCCTTCGCT 
CTCTCTGGGG AGGGCGAGCA TGTCTGGCTT CTGCTTTGTA AACGTAACAC TAATACTGTC 
TGGCTAGCGC GCCAGCTTGC CCGCATTGCC GGAGTGCGGC TAGTAGATGT GGGTTACGCA 
GGGCTAAAGG ATCGTCATGG GCTGACCACC CAATGGTTTA GCGTTAATTT GAGTGGAAAA 
AAAGAGCCAG CCTGGGCTAC AGCGTTGGAG TCTGCCACGG TTCAAGTGCT TAAGGTTATC 
CGCCATTCCC GAAAATTACA GCGGGGCGCG CTCAAGGGAA ACCGTTTTCT ATTGACCTTG 
CGCCACTTCC AGGGTGATCG GGAGGTTGTT TGCGACCGCC TGACACAGAT TAAAGTTGCG 
GGGACTCCCA ATTACTTTGG ACCGCAGCGT TTTGGCCGGG GGGGCCAGAA TCTGGATCAG 
GTGCACCGTT GGTTTAGTGG AGGCAAGCCA CCCAGGGGGC GTTATTTACG GGGAATGCTG 
CTTTCGGCAG CCCGCGCTTT TTTATTTAAT AGGGTCTTGT CGGAGCGCGT CCAGGCAGCT 
AATTGGTGGC AACCACTTCC AGGCGAGGCG CTTATTCTGG ATGGCAGCCA TGGCTTTTTT 
GTAGCGGAGA CCATAGATGA AGCCTTGCAA GCCCGGGTGA GGCGCTTCGA CTGCCATCCC 
AGTGGTCCTT TATGGGGGCG AGGGGAATCT CCCGCTAAGA GGATGAGCCG GGCTCTTGAG 
GAAGAGGTAT TGGCGGATTA CGCATTATGG CGGGAAGGTC TGGAGCAGGC AGGCTTAAAG 
CAAGAGCGCC GTAGTTTGCG TTTAATGGTA GCTGATTTGG AATGGTCTTT TCCTCCTGCT 
ATGGATAGCT TGCAGCTTCA TTTTCGTTTA CCCGCTGGGG CTTATGCCAC CACTGTATTG 
CGGGAAGTGG TCAGGACCCA AGAGGCGGTG GGACAGCCTT TCCTTTTAGA TGAATAA

Protein sequence

MEADEAGQQV LAYGGDPPLA TALLRCRPED FQVVEELPFA LSGEGEHVWL LLCKRNTNTV 
WLARQLARIA GVRLVDVGYA GLKDRHGLTT QWFSVNLSGK KEPAWATALE SATVQVLKVI 
RHSRKLQRGA LKGNRFLLTL RHFQGDREVV CDRLTQIKVA GTPNYFGPQR FGRGGQNLDQ 
VHRWFSGGKP PRGRYLRGML LSAARAFLFN RVLSERVQAA NWWQPLPGEA LILDGSHGFF 
VAETIDEALQ ARVRRFDCHP SGPLWGRGES PAKRMSRALE EEVLADYALW REGLEQAGLK 
QERRSLRLMV ADLEWSFPPA MDSLQLHFRL PAGAYATTVL REVVRTQEAV GQPFLLDE