Gene Hlac_3044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_3044
Symbol
ID	7398894
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012028
Strand	-
Start bp	302825
End bp	304009
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	61%
IMG OID	643706851
Product	Mur ligase family CapB protein
Protein accession	YP_002564473
Protein GI	222475952
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0285] Folylpolyglutamate synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTGGTCGA GCCGCCAAAC AGTGAAAAAG CAGGCACTCG ACGGACTCCG CACTGTCGCC 
AGCGGTGTTG TCGAGGCACT TGGTGCCGGT CCCGCCCACC GTCGGCGGCT CGATGAGATC 
GATACCCGAA TCGTCGTCAG TGGTGTCCGC GGGAAGTCAT CGGTGGCCAA CTGGCTGCAC 
GAACAGTTCG TCAGCCGCGG CTACGACACC TACACCAAGA TAACCGGATC CGATGCACAG 
GTTCGCTACA ACGACACCGT CTCCGAGATC GAGCGCGAAC AGCAGGTCAG ACTGTACGAA 
AACGAGCGTG AGCTGGCTCG GTTCGACAGT ATCGACGTCG CAATCGTCGA GAATCAAGGA 
ATCAGACCCT ACACGACACG GCTGGTCAAC GAGCAGTTCG TCGACCCCGA TCTGGTGTTT 
CTCACCAATG TCCGGGAGGA CCACCTCGAC ACGCTAGGCC GTGATCGCAC CCAGATCGCT 
CGGTCGCTCA CCCGTGCAGT CCCTCAGGGG ACATCAGTTG TCTGTGCCGA ACAGTACAAA 
CCGCTACGTG AGTACATCCA GACCGAACTC GAGCGTCGGG ATGCACCAGT TACCTTCGTC 
GACCCGCCGT CGGGGACCGA GAGCGTGCCA GGCAGTGAGT GTGTGTATGG GCTCAACGAC 
GTGCTCGCAG CAGTCGGTGA GCCGCCTGTT CCAACCCAAG AGATCCAGGA CCGAATCGAT 
ACGCTTCGTC CGTCGTGGCA GCAGCTTCCT GGTGGTCGGG TGTACAATGC GGCGGCGGTC 
AACGACGTCC AGAGCACGGA ACTCGTTCGA CAGTCGCTCG TTGAGGATCG GGAGACAGTA 
ATCGAACCAG TGTTGAACCT CCGGTGGGAT CGCCGGGGGC GAACGGTGTC GTTCATCCGC 
TATCTCGACG ACCTCTACGA GTCGGGGGCA GTCGAGCAGA CCCACATCGT CGGCGACGAT 
CAACAGCTGT TCGAGACGAC CGCCTCCCTC CCGGTCGTTC GCCACGACAC CGAGACTGAA 
TCGCCGGCGG CAGTTCTAGA TGACGCGGTA GCCTCGGGTC GGCCAGTGGT GCTGATGGGC 
AACACAGTCA CGGCGTTCAT GGAGGCGATG GCCAGGGAAA TCGAGAGCCG AGCAGGGACA 
GACAGTGACG CTCCGGAGGC GACAACCGCT CCAGAAACAG CCTGA

Protein sequence

MWSSRQTVKK QALDGLRTVA SGVVEALGAG PAHRRRLDEI DTRIVVSGVR GKSSVANWLH 
EQFVSRGYDT YTKITGSDAQ VRYNDTVSEI EREQQVRLYE NERELARFDS IDVAIVENQG 
IRPYTTRLVN EQFVDPDLVF LTNVREDHLD TLGRDRTQIA RSLTRAVPQG TSVVCAEQYK 
PLREYIQTEL ERRDAPVTFV DPPSGTESVP GSECVYGLND VLAAVGEPPV PTQEIQDRID 
TLRPSWQQLP GGRVYNAAAV NDVQSTELVR QSLVEDRETV IEPVLNLRWD RRGRTVSFIR 
YLDDLYESGA VEQTHIVGDD QQLFETTASL PVVRHDTETE SPAAVLDDAV ASGRPVVLMG 
NTVTAFMEAM AREIESRAGT DSDAPEATTA PETA