Gene Hneap_1996 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hneap_1996
Symbol
ID	8535155
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothiobacillus neapolitanus c2
Kingdom	Bacteria
Replicon accession	NC_013422
Strand	-
Start bp	2139340
End bp	2140398
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	57%
IMG OID	646384378
Product	NUDIX hydrolase
Protein accession	YP_003263865
Protein GI	261856582
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0352] Thiamine monophosphate synthase
TIGRFAM ID	[TIGR00586] mutator mutT protein

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.42027
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCCTC CGGAAGAAAC ACGAATCGCA CTCGCAGTTT TACCGGCCGG ACCGAATCAG 
GCCGGTCTTC CCCAATATTG GCTTGAGCGC CGCCCCGATT CTGCGCATCT GGGCGGGATG 
CTGGCGTTTC CCGGTGGCAA GTGCCAGCCG GATGAATCTC CCACAGATGC ATTGGCTCGC 
GAACTGTTTG AGGAACTCGG TATCCTGCCG CAAGCGTCGC GGTTGCTTAT GGAAATTCCC 
TGGGTTTACT CGGCCAATTC AAGCGATCTT GAAGGCAAAC CGAAATCCAA GCACCTTCGC 
CTCATTGTCT ATCGAGTCGA AAAGTGGCAA GGCGAACTTC ATGGCCGCGA AGGACAATCG 
GTAACAGCTC AAACACTGGA TTGCAGTCGG CATGGCGAGT GGATGAGCGC CTTGCCACCT 
GCCAATCGGG GGATTGTCGC TGCCTTGTGC CTGCCGCCTC GAATAGCAAT TACAGCTGCG 
TGCGGTGCGG GCGATGCCGG GTTTTCCGTT TGGCATCAGG CATTGGTCAA GACAGCCAAT 
GCGCTTAGAC AGCAATTTCG ATCGTCATTT GGGGGGCGAT CATCCATCGT GCAATTACGT 
CCCGGTCGGG ATCTAAGCAT GGCCCAGTGG ACCGCCGCAG TGGCCACCGT TCAGTCGTTT 
GAGTTGTCCG CGTGGGTGAA TGCGAGTTTG GATATTGCCA TATCGTGTCG CGCAGATGGT 
GTTCACTTAA ATCGACACCG TCTGGCCTCG GTGGATCGGG AAGCCCTGGC GAATTGGCGT 
GCACAAAATC GTTGGGTTAG TGCATCCGGC CATACCTTGG AAGAAGTGCG ATTGGCCAAT 
GAGGTCGGCG TCGATGCCTT GCTGATTTCT CCCATCCTAC CAACGTTAAG CCATCCGGGA 
GAATCCGGAA TCGGTTGGGC ACAGTTCGCG GAATTGACTC GCGAAGCCAC CATGCCCACC 
TATGCGCTTG GTGGCATCTT GGAAACGCAC CTGCCCCAGG TGCAAATGTT GGCAGGGCAG 
GGGGTCGCCG CCATTCGTGG CTATTGGATG GACTCTTGA

Protein sequence

MSPPEETRIA LAVLPAGPNQ AGLPQYWLER RPDSAHLGGM LAFPGGKCQP DESPTDALAR 
ELFEELGILP QASRLLMEIP WVYSANSSDL EGKPKSKHLR LIVYRVEKWQ GELHGREGQS 
VTAQTLDCSR HGEWMSALPP ANRGIVAALC LPPRIAITAA CGAGDAGFSV WHQALVKTAN 
ALRQQFRSSF GGRSSIVQLR PGRDLSMAQW TAAVATVQSF ELSAWVNASL DIAISCRADG 
VHLNRHRLAS VDREALANWR AQNRWVSASG HTLEEVRLAN EVGVDALLIS PILPTLSHPG 
ESGIGWAQFA ELTREATMPT YALGGILETH LPQVQMLAGQ GVAAIRGYWM DS