Gene Hlac_2471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2471
Symbol
ID	7401523
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	2449231
End bp	2450391
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	71%
IMG OID	643709543
Product	nicotinate phosphoribosyltransferase
Protein accession	YP_002567114
Protein GI	222480877
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1488] Nicotinic acid phosphoribosyltransferase
TIGRFAM ID	[TIGR01513] putative nicotinate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAGT TCGATATCGT CGACGCGGCC GCGATTCGCG ACGGCCGGGC GACCGACGCG 
TACTTCGAGC GGACCGAGGC CGCCTTGGAA CACGCGGGAC GAAACCCCCG CGTCGTCGCC 
GAGGTCACCG CTGACCAATT CCCCGACGGC GACTTCGAGC TGTTCGCCGG GCTGAAAGAC 
GCGGTCGCGC TCTTGGAGGG GCGCGATATC GACGTCGACG CGATTCCGGA AGGCCGCCTA 
TTCGACGGCG GTCCGGTGAT GCGAATCGAG GGACCGTACC TCACGTTCGC GCGGCTGGAG 
ACCTCCCTCC TCGGCTTCCT CTCGCACGCC TCCGGGATGG CGACCGCGGC CCTCGACTGC 
CGGGTCGCGG CGCCGGACTC GCAGGTGCTC TCCTTCGGCG CGCGCCACGT CCACCCGTCG 
ATGACCGCGG CGGTCGAGCG CTCCGCGCTG GTTGGCGGGT TCGACGGGTT CTCGCACGTC 
GCCGCCGGCG ACCTGATCGG CCGGGAGGCC TCGGGGACGA TGCCCCACGC GCTCTCCATC 
TGCTTCGGCC GTGGCGAGCA GGAGGCCGCG TGGCGCGCCT TCAACGAGGC CGTCGACGAG 
GCGGTCCCGC GGATCGCCCT CTGTGACACC TACTCCGACG AGGTCGACGA AACACTCCGA 
GCGGTCGACG CGCTCGGCGA TCGGCTCGAC GGCGTCCGGC TCGACACCAC CGGCTCGCGT 
CGCGGCGACT TCCGGCACAT CATTCGGGAA GTGCAGTGGG AGCTGGACGT TCGCGGCCAC 
GACGACGTCG ACGTGTACGT CTCCGGCGGG CTCGGGCCGG CCGACCTCCG CGAACTCCGC 
GATGTGGTCG ACGGCTTCGG CGTGGGCGGG TACGTCTCGA ACGCCGACCC GGTCGACTTC 
GCGCTCGACA TCGTCGCCGT CGAGGGGGAG CCGGCCGCCA AGCGCGGCAA GCTCTCCGGC 
GCGAAGGACG TGTATCGCAC CGCTGACGGC GTCCACGCTG TCGGACTAGC CGACCGGTCG 
GGTCCCGACG GTGCCGAGTC GCTCATGGAG CCGGTGATCC GCGACGGCGA GGTCGTCGCT 
GACGACGCGT TCGACCTCGC GGCCGCGACG GAGCGCGCGC TTGCGGACGC TGAGACCGTC 
GGCTACGGGA CGAACGAGTA G

Protein sequence

MTEFDIVDAA AIRDGRATDA YFERTEAALE HAGRNPRVVA EVTADQFPDG DFELFAGLKD 
AVALLEGRDI DVDAIPEGRL FDGGPVMRIE GPYLTFARLE TSLLGFLSHA SGMATAALDC 
RVAAPDSQVL SFGARHVHPS MTAAVERSAL VGGFDGFSHV AAGDLIGREA SGTMPHALSI 
CFGRGEQEAA WRAFNEAVDE AVPRIALCDT YSDEVDETLR AVDALGDRLD GVRLDTTGSR 
RGDFRHIIRE VQWELDVRGH DDVDVYVSGG LGPADLRELR DVVDGFGVGG YVSNADPVDF 
ALDIVAVEGE PAAKRGKLSG AKDVYRTADG VHAVGLADRS GPDGAESLME PVIRDGEVVA 
DDAFDLAAAT ERALADAETV GYGTNE