Gene Hlac_1387 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1387
Symbol
ID	7400706
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	1396004
End bp	1397221
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	69%
IMG OID	643708448
Product	dihydropteroate synthase
Protein accession	YP_002566045
Protein GI	222479808
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0294] Dihydropteroate synthase and related enzymes
TIGRFAM ID	[TIGR01496] dihydropteroate synthase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.398618
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAAACG TGGACGCCGC GGGGCTCGAG ATCGGCGACG ACCACCCGCC TCGGATCATG 
GGCGTACTCA ACGTCTCCGC GGAGTCGCCG TACGACCCGA GCGTGTACGA CGACCCGGGC 
GAGGCCGCCG AGTACGTCGA CGAGGAGCTG ATCGGCGAGG GCGCCGACAT CGTCGACGTC 
GGGCTCGAAT CGGCCAACAA GGACTTAGAC GTGCTCTCGG CCGAACAGGA GTTGGATCGG 
CTCGACACCG CGATCGAGAC GCTGGAGTCG ACCTCGGGCG ACGCCGTCTG GTCGATCGAG 
ACCCGCTACC ACGAGGTCGC CGACGAGGCG CTTGCACGCG GGTTCGACAT GGTCAACGAC 
ATCTGCGGCT TCGCCGATCC CGAGATGCCC CGCGTCTGCC GCGAACACGA CGCGGCCGTC 
TCGAAGATGG CCTCGCCGCC AGATCTGGAG CGACCGGGTG CCATCGAGGA CGTGGACGAG 
ATCTACGAAG CGCTGTCGAT GAACGGCCTC ACCGACAAGA CGATCCTCGA CCCCGCGTTC 
GGTGGCTGGT CGAAGGCAAA AACCCACGCC GACGACCGCG AGACGTTCCA CCGGCTACGG 
GAGTTCCGCG GCTACGGTCG CCCGCTGCTC GTCTCGATCA ACCGCAAGAG CTTCCTCAAG 
ACGATCGCGG GACGGAGTAC CGAGGAGGCC CTTCCGGTGT CGCTCGCCGC CACCTCGATG 
GCAGTCGAGC GCGGCGCACA CGTGATCCGC ACCCACGATG TGGCCGAGAC GCGGGACGCG 
GCACTCGTCG GCGCCGAGTT CGCCCGCGAT CGGGTCCGTT CGGACGACGG GCCCAGCGAC 
ATCGCCGTCG AGGAACTCGA CGTGACGACC GTTCGGGAGG CCGAGCGCCA CCTCGACCGG 
CTGGACGCCG ACCAGTCCGT CGCCGGCGAC GCGGCCGTTC GCACCTACGA GCTACGCGGG 
CTCACCGACG AGGCCGTCGG CGCGCTCCGA GCGGCGACCG CCGAGCCCGG CGTCGGCGCG 
GCGTTCGCCC TCGCCGGTTC CGACGCCGCC GAGACCGCGG TTCCCCCCTC GGCCACCGAC 
GGCGGGGCCC CCACAAATGG CGAATCCGGA CTGCTCGTCG GAACAGTAGC CGCGCTGTCT 
GCGGTTCGAT CGGCCGTTTC GGGCGTTTCA GACGCGCTCG ACGCCGCGCT GGAATCGATC 
GACGACGGCT CCAAGTAA

Protein sequence

MRNVDAAGLE IGDDHPPRIM GVLNVSAESP YDPSVYDDPG EAAEYVDEEL IGEGADIVDV 
GLESANKDLD VLSAEQELDR LDTAIETLES TSGDAVWSIE TRYHEVADEA LARGFDMVND 
ICGFADPEMP RVCREHDAAV SKMASPPDLE RPGAIEDVDE IYEALSMNGL TDKTILDPAF 
GGWSKAKTHA DDRETFHRLR EFRGYGRPLL VSINRKSFLK TIAGRSTEEA LPVSLAATSM 
AVERGAHVIR THDVAETRDA ALVGAEFARD RVRSDDGPSD IAVEELDVTT VREAERHLDR 
LDADQSVAGD AAVRTYELRG LTDEAVGALR AATAEPGVGA AFALAGSDAA ETAVPPSATD 
GGAPTNGESG LLVGTVAALS AVRSAVSGVS DALDAALESI DDGSK