Gene Hneap_1691 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hneap_1691
Symbol
ID	8534849
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothiobacillus neapolitanus c2
Kingdom	Bacteria
Replicon accession	NC_013422
Strand	+
Start bp	1820127
End bp	1821128
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	60%
IMG OID	646384075
Product	TIM-barrel protein, nifR3 family
Protein accession	YP_003263563
Protein GI	261856280
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00737] putative TIM-barrel protein, nifR3 family

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGAAT CGCCTCCGCT GCCGCCCATC ATTCTGCACG GGCGAACCGG AGACCCGGTC 
ATCATCGACC CACCGCTCGC GCTCGCCCCC ATGGCCGGTG TTTCAGACCG CCCTTTCCGC 
CAGCTCTGCC GTGAATACGG CGCAGGGCTG GTGGTCACGG AAATGATGAG CGCCAAACCG 
GAACTGCAAT CCAGCGCCAA AAGTCGCCTG CGCCAAATCG ACAGCAACGA CATCGAACCC 
CGTGCGGTGC AGCTGCTGGG CAATGATCCG TTTGAGCTGG CCGAAGCCGC CCGATTTGCA 
GTCTCGCAAG GCGCACAACT GATCGACCTC AACCTCGGCT GCCCTGCCAA AAAGGTATGC 
AAACGCGCTG CAGGATCTGC ACTCATGGCA GAACCGGATA CCGTCGCCCG CCTTCTGGAA 
GCACTGGTGG CCGCCGTCGA TTGTCCGGTT AGCCTGAAAA TGCGCACCGG TCCGGACCGC 
GAGTGGCGCA ATGCCGTTGC GATCGCAAAA ATCGCCGAGA ATGCCGGGAT ATCCATGCTG 
TCGATCCACG GGCGCACCCG CGCAGACCGC TACGAAGGCG AAGCGGAATA CGACACCATT 
GCCGAAGTGG TTGCCGCCGT CGACCTGCCA GTGTTTGCCA ATGGCGACAT CACTACCCCT 
CAGAAAGCCC GTCAAGTGAT CGCCCATACG GGCGCCGCGG GCATCATGGT CGGACGAGGC 
GCGTTTGGTC AGCCCTGGAT TTTCTCCGCG TTAAAAGCCG AGCTCACCGG CCAACCACTC 
CCCAGCCCCC CGGATCGCGC CGAACGTGTC GTTGCCATCA AAAAACAATT TGAAAAAATC 
TATCATCATT ACGGCGACTC ATTAGGAATT CGCATCGCCC GAAAGCATCT GGGCTGGTAT 
GCTGCGTCCC TTGAATTGGG TGAAGAAGAT CGAGCTGTAT TCAACCGCTT CGAGCACCCT 
GAACAGCAAC GCCAATGGTT AGCGCAGCAC GCTAACGGAT AA

Protein sequence

MAESPPLPPI ILHGRTGDPV IIDPPLALAP MAGVSDRPFR QLCREYGAGL VVTEMMSAKP 
ELQSSAKSRL RQIDSNDIEP RAVQLLGNDP FELAEAARFA VSQGAQLIDL NLGCPAKKVC 
KRAAGSALMA EPDTVARLLE ALVAAVDCPV SLKMRTGPDR EWRNAVAIAK IAENAGISML 
SIHGRTRADR YEGEAEYDTI AEVVAAVDLP VFANGDITTP QKARQVIAHT GAAGIMVGRG 
AFGQPWIFSA LKAELTGQPL PSPPDRAERV VAIKKQFEKI YHHYGDSLGI RIARKHLGWY 
AASLELGEED RAVFNRFEHP EQQRQWLAQH ANG