Gene Hneap_1148 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hneap_1148
Symbol
ID	8534300
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothiobacillus neapolitanus c2
Kingdom	Bacteria
Replicon accession	NC_013422
Strand	+
Start bp	1247515
End bp	1248606
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	52%
IMG OID	646383537
Product	tRNA pseudouridine synthase D TruD
Protein accession	YP_003263031
Protein GI	261855748
COG category	[S] Function unknown
COG ID	[COG0585] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00094] tRNA pseudouridine synthase, TruD family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGCCA ACCCCGGGCC ACTGGATCAG TTGTTGTATC ACGGCGCTCC GCCCATTCTG 
CAAGGGCAGT TGAAACAATC TCCATCAGAC TTCCGCGTGG ATGAAATCCT CGGGTTTGAA 
CCGGACGGAG AAGGTGCCCA CGGTCTGTTT CTGGTCGAGA AAACGGGAAT CACCACGGGG 
CAGATGCTGG GGCTACTGTC CAAATTATCC GGTGTGGCAG AAAGAGACAT CGGCTTTTGC 
GGCATGAAGG ACAAACTCGC GGTCACATCC CAGTGGGTCA GTCTGCCTTT GATGCCATCG 
CATTCATTAG AGAACCCTCC GGATTGGATC GATGCATTAC CCGATCACGT AAAAGTGCTT 
CGCTGGAACC TGCATCGCAA GAAGCTGCGT CGGGGTAGTC ATCGGGGTAA CCGCTTCACT 
GTTACGATTC GCGATGTCAT AGGGCATGAC CCAGAACTTC GGCAACGAAT TGAAAGGTTA 
GAGTCGCAGG GTTTTCCCAA TTACTTTGCC GAGCAGCGGT TCGGGCATGC GGGAAGCAAC 
TATGCCTTGC TCGAAAAGCT GGGACGATTA TCGAACGCCC GTTCAATTAG TCGCGCTGAT 
CGAAACTGGG GCATATCGAC GCTCAGAGCT GAAATCTTCA ACCGGGTCTT GTCCGATCGT 
CTGTCCCAAA ACACTGAAGC CACCGCTAAA CCTGGCGATC TGGCCCGTCT TGCGGGCACA 
AATAGTTGGT TTTTAGTTGT CGAGGAAGAG TTGAACAACA CACAGCAAAG AATTGATACC 
AAAGATATTT GGCTTACGGG GCCGCTCTGG GGTGAAGGAC CGAGTCCCGC CTTTGGAGAT 
ATTAAGACTG AGGAAACCCG AATCGTAGAA GAAGTTTTAA CGAGCTACGG CTCGGAGAAT 
TGGTCGAATC ACCTGCGCGA CTGGCGGGTT GAACATGATC GACGCGCTCT AATGGCACCG 
ATAACCAATT TGCAGTGTGA AGAAAAGACA GAGGAGGGCA GCCGTATCCT CAATCTGTCA 
TTTGCATTGG AATCAGGAAG TTATGCGACA GCTTTGCTTC GGGAAATTAT TGATCTGACA 
CCGGCAGATT GA

Protein sequence

MSANPGPLDQ LLYHGAPPIL QGQLKQSPSD FRVDEILGFE PDGEGAHGLF LVEKTGITTG 
QMLGLLSKLS GVAERDIGFC GMKDKLAVTS QWVSLPLMPS HSLENPPDWI DALPDHVKVL 
RWNLHRKKLR RGSHRGNRFT VTIRDVIGHD PELRQRIERL ESQGFPNYFA EQRFGHAGSN 
YALLEKLGRL SNARSISRAD RNWGISTLRA EIFNRVLSDR LSQNTEATAK PGDLARLAGT 
NSWFLVVEEE LNNTQQRIDT KDIWLTGPLW GEGPSPAFGD IKTEETRIVE EVLTSYGSEN 
WSNHLRDWRV EHDRRALMAP ITNLQCEEKT EEGSRILNLS FALESGSYAT ALLREIIDLT 
PAD