Gene Hlac_2166 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2166
Symbol
ID	7401099
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	2155086
End bp	2156114
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	68%
IMG OID	643709236
Product	thymidylate synthase
Protein accession	YP_002566813
Protein GI	222480576
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0207] Thymidylate synthase
TIGRFAM ID	[TIGR03284] thymidylate synthase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAACAAT ATCTCGATCT CGTCGACGAC ACCCTGTCGA CGGGCACGTA CAAGCCGAAC 
CGAACGGGCG TCGACACGAT CGCGACGTTC AGCGGGCAGT ACACCGTCGA CCTCTCGGAG 
GGGTTCCCGC TCCTCACGAC CAAGAAGATG GACGGCTACC GCTGGAACTC GCTGATCCAC 
GAGGTGCTCT GGTACCTCTC CGGCGAGGAG CACATCCGGG ACCTCCGCGA GGAGACGAAG 
ATCTGGGACG CGTGGGCCGA CGACGAGGGC CGCCTCGACA CCGCGTACGG TCGGTTCTGG 
CGCCGGTTCC CCGTGCCGGA CGGCGTCGAC GCGCTCCCCG GCGAGACGTG GCCGAAGGAT 
GCGCACCGCT GGGTCACCGT CGAGGAGGGG CCGGAGGGCG TCGAGCGCCG GACCTTCGAC 
CAGATCCAGT ACGTGCTCGA CACCCTCGAC GAGAACCCCC GGTCGCGCCG GATGGTCGTG 
AACGCGTGGC ACCCCGCCAA CGCCGCTGTC TCGACGCTGC CGCCGTGTCA CTACACCTTC 
GTGGTGAACG TCCAGGACGG GCGGCTCAAC CTCCACCTCA CGCAGCGCTC GGGCGACATC 
GCGCTCGGGG TGCCCTTCAA CATCGCCGCG TACGCGCTGC TCGCGAACGC GCTCGCACAG 
CGAACGGGGT TCGAGATCGG CGAGTTCGGC CACACCGTCG TCGACGCCCA CATCTACTGC 
GGGCGCGGCG ATCGCGGGCA GTGGTACGCG AACAACCTCC GGTACGTGCA AGACCGGCTC 
GCGACCGTCG AGAGCAAGGC CGACTACCTC GACGTGAAGA GCTGGGTCGA GCGGACCGCC 
CCCGACGAGG CGGACGGCGA GGAGAGGTAC GACCACGTCC CCGGGCTGCT CGAACAGCTC 
TCGCGGGAGC CGCGCGAGCG ACCCCGGATC GAGATCGCCG ACAAGCCGCT CGACGAACTC 
ACGTACGAGG ACATCGAGGT CGTCGACTAC GACTCCGCGG ACGGCATCTC GTTCGCGGTC 
GCGGAGTGA

Protein sequence

MQQYLDLVDD TLSTGTYKPN RTGVDTIATF SGQYTVDLSE GFPLLTTKKM DGYRWNSLIH 
EVLWYLSGEE HIRDLREETK IWDAWADDEG RLDTAYGRFW RRFPVPDGVD ALPGETWPKD 
AHRWVTVEEG PEGVERRTFD QIQYVLDTLD ENPRSRRMVV NAWHPANAAV STLPPCHYTF 
VVNVQDGRLN LHLTQRSGDI ALGVPFNIAA YALLANALAQ RTGFEIGEFG HTVVDAHIYC 
GRGDRGQWYA NNLRYVQDRL ATVESKADYL DVKSWVERTA PDEADGEERY DHVPGLLEQL 
SREPRERPRI EIADKPLDEL TYEDIEVVDY DSADGISFAV AE